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U Elements de genetique 

mendelienne 



1 . 1 La demarche de Gregor Mendel 

1.2 Lemodele3:1 chezl'homme 

1 .3 Dominance et recessivite, multiallelisme 

1.4 Alleles letaux 

1.5 Actualite du concept de gene 



Reviser les elements de base de I'analyse mendelienne 
Approfondir la notion de caractere hereditaire 
Examiner la relation entre genotype et phenotype 
Reflechir a la notion de gene 


1.1 LA DEMARCHE DE GREGOR MENDEL 

Dans le memoire publie par Gregor Mendel en 1866, on ne trouve 
nulle reference aux genes ou a la genetique, deux mots qui n’appa- 
raissent qu’en 1905. Pas de reference non plus aux chromosomes, qui 
n’ont pas encore ete observes, ni d’ailleurs a l’heredite. Pourtant, 
l’interet fondateur du travail de Gregor Mendel, est d’ avoir aborde 1’ etude 
de la variation des caracteres entre parents et descendants, en limitant 
le nombre des caracteres, en choisissant un modele biologique peu 
sensible aux conditions de l’environnement, et surtout en adoptant une 
demarche d’analyse quantitative simple, consistant a compter a chaque 
generation les individus qui presentent le caractere selectionne par 
l’experimentateur. Gregor Mendel mit ainsi en lumiere par ces choix, 
l’existence d’une sorte d’algebre capable de predire la distribution des 
caracteristiques d’un individu en revelant 1’ existence de causes cachees, 
conservees dans les cellules sexuelles et transmissibles a la generation 
suivante selon une combinatoire statistiquement invariable. 

Redecouvert au debut du xx e siecle apres 40 ans d’oubli, le travail 
de Gregor Mendel suscita immediatement un engouement extraordi- 
naire. La premiere tache fut de tester et de clarifier les trois principes 
ou « lois » de Mendel : la « loi » de dominance (qu’il n’avait pas 
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formulee !), la « loi » de disjonction des caracteres et la « loi » de 
segregation independante des caracteres. En raison de nombreuses 
exceptions, la loi de dominance fut tres vite abandonnee, celle de la 
segregation independante contestee (il faut que les caracteres soient 
portes par des chromosomes separes) et celle de disjonction (« loi de 
purete des gametes »), la seule reellement universelle, rencontra 
certaines exceptions. La plupart de celles-ci s’expliquent par des 
mecanismes particuliers n’affectant pas fondamentalement la regie. 
C’est le cas de l’epistasie (voir plus loin) ou alteration de l’expression 
d’un gene par un autre gene ; c’est le cas aussi des alleles multiples, 
des « polygenes » (differents genes sont susceptibles de modifier 
1’ expression quantitative d’un meme caractere). Tous ces phenomenes 
ont finalement renforce le modele de Mendel, car ils n’affectaient que 
1’ expression des genes, non les regies de transmission. 

Le modele 3:1 

Les lignees parentales sont pures. Croises entre eux, les individus de 
chaque lignee transmettent a leurs descendants des caracteres homo- 
genes et exclusifs. Les lignees selectionnees par Gregor Mendel 
different chez les parents pour un seul caractere. II observe et denombre 
les deux phenotypes parentaux sur chaque individu de la descendance 
de premiere generation (FI, filiation de l re generation) obtenue par 
croisement des parents et sur la descendance de deuxieme generation 
(F2) obtenue par croisement des individus FI entre eux (Tableau 1.1). 


Tableau 1 .1 Resultats obtenus par Gregor Mendel dans les croisements 

DE LIGNEES PURES DE POIS DIFFERANT PAR UN CARACTERE. 


Phenotypes parentaux 
en croisement 

Phenotype 

deFI 

Phenotype 
de F2 

Rapport des 
2 phenotypes de F2 

Graines lisses x ridees 

100% lisses 

5 474 lisses 
1 850 ridees 

2,96:1 

Graines jaunes x vertes 

100% jaunes 

6 022jaunes 
2 001 vertes 

3,01:1 

Petales violets x blancs 

1 00 % violets 

705 violets 
224 blancs 

3,15:1 

Gousses jaunes x vertes 

1 00 % vertes 

428 vertes 
152 jaunes 

2,82:1 

Fleurs axiales x terminates 

100% axiales 

651 axiales 
207 terminates 

3,14:1 
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Chez les individus FI, l’un des deux phenotypes parentaux est 
dominant et observable, 1’ autre est recessif et cache. Cependant tous 
les individus FI possedent potentiellement la capacite d’engendrer 
les deux phenotypes puisque le phenotype recessif reapparait a la 
generation F2 et represente le quart des « individus » (rapport des 
phenotypes F2 proche de 3:1). Par Fexamen des individus de la gene- 
ration F3, obtenue par autofecondation des individus F2, Gregor 
Mendel revele que les individus F2 se distribuent en realite selon un 
rapport genotypique 1:2:1. Autrement dit chaque plante FI possede 
une paire de genes pour un caractere phenoty pique : Fun des genes est 
responsable du phenotype dominant, F autre du phenotype recessif. 
Les deux genes se distribuent a la meiose dans les gametes male et 
femelle de sorte que chaque gamete ne possede qu’un des deux genes 
parentaux. Au moment de la reproduction, la formation de l’oeuf par 
la fusion des gametes produit un descendant avec une paire de genes 
reconstitute aleatoirement. 

Un gene peut exister sous differentes formes denommees alleles 
(ou allelomorphes, formes alternatives). Un individu, ne de la fusion 
des gametes (ovule et spermatozoide), regoit deux lots de genes 
« equivalents » formant un seul ensemble de genes apparies (paires 
de genes). On doit dire en realite paire d’ alleles. En effet, chaque gene 
(nomme par exemple : « G ») se trouve represente chez cet individu 
sous la forme de deux alleles. Fun maternel, F autre paternel. Les 
alleles ainsi reunis peuvent etre identiques ou differents. Lorsqu’ils 
sont identiques F individu sera dit « homozygote » ( GG ou gg) et 
lorsqu’ils different, il sera dit « heterozygote » (Gg). L’un des deux 
alleles du gene peut l’emporter sur F autre dans son expression 
(F allele G est dit dominant sur F allele g, dit recessif). On parlera 
d’ homozygote dominant (GG) ou d’ homozygote recessif (gg) lorsque 
les 2 alleles sont identiques. Chaque individu possede une formule 
genetique appelee genotype qui regroupe 2 alleles parmi tous les 
alleles de ce gene presents dans F espece. On dira par exemple que 
GG et Gg sont deux genotypes distincts, alors que les phenotypes sont 
generalement similaires puisque G domine surg. Le genotype de tout 
individu possedant deux alleles du gene « G » aura au choix la formule 
GG ou Gg ou gg. On voit ici que gene et allele sont deux termes associes 
dans une relation proche de celle qui reunit par exemple les termes 
genre et espece. Un genre peut avoir de nombreuses especes, et une 
espece appartient a un genre. Un gene peut avoir de nombreux alleles, 
et un allele se rapporte toujours a un gene. A Fechelle moleculaire, 
la comprehension des deux termes s’avere finalement plus simple. 
Puisqu’un gene est une sequence en bases de l’ADN, dotee d’une 
fonction, toute sequence modifiee, meme sur une seule base, alterant 
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ou non la fonction, doit etre consideree comme un allele. Ainsi, pour 
un gene donne, le nombre d’ alleles est theoriquement eleve, mais 
dans la nature, les alleles n’exergant plus la fonction correspondante, 
surtout si elle est vitale, sont en regie generate elimines avec les indi- 
vidus homozygotes qui les portent. Finalement dans une population 
formee de nombreux individus, un gene donne pourra se presenter 
sous la forme de nombreux alleles (cela peut alter jusqu’a plusieurs 
centaines). Mais chez un individu particulier on ne trouvera pour un 
gene donne au mieux que 2 alleles distincts (individu heterozygote) 
ou meme un seul si 1’ individu est homozygote (les 2 alleles sont 
identiques). 

Le modele 9:3:3:1 

Les lignees parentales sont pures (homozygotes) et different par deux 
genes controlant deux caracteres separes (4 phenotypes). Comme 
precedemment, on denombre les individus des generations F 1 obtenus 
par croisement des parents et F2 par autofecondation entre individus 
FI. 

Des calculs effectues pour chacun des couples de caracteres, on peut 
conclure qu’ils sont independants puisque Fun et l’autre repondentau 
modele 3:1. Le rapport 9:3:3:1 n’est finalement que le produit aleatoire 
de deux rapports independants 3:1 (Tableau 1.2). 


Tableau 1 .2 RGsultats obtenus par Gregor Mendel dans le croisement 

DE DEUX LIGNEES PURES DE POIS DIFFERANT PAR DEUX CARACTERES. 


Phenotypes 

parentaux 

Phenotype 

deFI 

Phenotype 
de F2 

Rapport des 
phenotypes 
de F2 

Rapport 
des phenotypes 
de F2 pour 
le caractere 
lisse/ride 

Rapport 
des phenotypes 
de F2 pour 
le caractere 
jaune/vert 

Graines 
lisses 
et vertes 

X 

Graines 

ridees 

etjaunes 

100% 
de graines 
lisses 
etjaunes 

315 lisses 
etjaunes 

9 

— (3,18:1) 
133 

— (2,97:1) 
140 

108 lisses 
et vertes 

3 

101 ridees 
etjaunes 

3 

32 ridees 
et vertes 

1 
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Verification experimentale des deux modeles 
par le croisement test 

Verification du modele 3:1 

Le croisement de pois a graines jaunes ( JJ ) et de pois a graines vertes 
(jj) donne ( Tableau 1.1) une generation FI a phenotype dominant, a 
graines jaunes et de genotype heterozygote (Jj). En croisant un 
hybride F 1 (Jj) avec une lignee homozygote recessive a graines vertes 
(jj) on peut predire (Fig. 1.1 ) qu’il y aura autant de graines jaunes que 
de graines vertes dans la descendance. Le croisement test (ou test- 
cross) predit done un rapport de phenotypes egal a 1:1 (voir aussi 
chapitre 6, Fig. 6.3). 


Gametes 


(Heterozygote FI) 

(Homozygote recessif) 

Ji 

ii 

Graines jaunes 

Graines vertes 

0 

■ 0 

J i 

i i 


a 

o 

c 

=3 

Q 

in 

T 1 

O 

r\j 

© 


Genotypes 


(Rapport 1:1) 



jj jj jj jj 

Graines jaunes Graines vertes 


O 0 

50 % jaunes 50 % vertes 


Figure 1 . 1 Croisement d'un pois heterozygote (hybride FI) avec un pois homo- 
zygote recessif. 


Verification du modele 9:3:3:1 

Le croisement de pois a graines lisses et vertes avec des pois a graines 
ridees et jaunes (Tableau 1.2) donne une generation FI ou toutes les 
graines sont lisses et jaunes, avec un genotype sous-jacent hybride 
RrJj. En croisant un tel individu FI double heterozygote avec une 
lignee double homozygote recessif (Fig. 1.2) on peut predire qu’il y 
aura equiprobabilite de rencontrer les 4 phenotypes (graines jaunes et 
ridees, vertes et ridees, lisses et jaunes et lisses et vertes) dans la 
descendance, soit un rapport 1 : 1 : 1 : 1 . 
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(FI double heterozygote) 

Rrjj 

Graines lisses et jaunes 


(double homozygote recessif) 
rrjj 


Graines ridees et vertes 



X 



Gametes RJ Rj rj rj 


100% rj 



Descendance 


Rrjj Rrjj 


rrjj rrjj 



Graines Graines Graines Graines 

lisses et lisses et ridees et ridees et 
jaunes vertes jaunes vertes 


(Rapport 1 : 1 : 1 :1 


25 % 25 % 25 % 25 % 


Figure 1.2 CroisementcTun pois ; double heterozygote (hybride FI), avec un pois 
double homozygote recessif. 


Le test de croisement s’opere done entre 1’ heterozygote de la gene- 
ration FI et un homozygote recessif. II permet a l’experimentateur 
d’ analyser le genotype sous-jacent a un phenotype dominant puisque 
le parent homozygote recessif n’apporte que les alleles recessif s a 
sa descendance. II peut etre applique d’une maniere generate a la 
determination du genotype d’un individu. 

Methode de calcul des rapports genetiques 
dans les hybrides 

Elle est basee sur le produit des rapports et s’ applique aux phenotypes 
comme aux genotypes. 

Diagramme pour le double hybride 

Lorsqu’on ecrit ( R - ) ou ( J - ) cela signifie (Fig. 1.3 ) que 1’allele dominant 
(R ou J) qui impose le phenotype peut etre indifferemment apparie 
avec un autre allele dominant ( RR ou JJ) ou avec un allele recessif (Rr 
ou Jj) sans modification du phenotype. 
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3: 1 


3:1 


Composition de F2 


Descendance 


Rapport : 


(*-) (") (J-) 07) 



0 0 © 

9 3 3 1 


Figure 1 .3 Produits des rapports genetiques pour un double hybride. 


Generalisation :exemple d'un diagramme pour un triple hybride 

On admet comme precedemment qu’il y a segregation independante 
des trois genes correspondants aux trois couples de caracteres avec 
dominance d’un des deux alleles. A la generation F2, on a la descen- 
dance correspondant au croisement ( AaBbCc x AaBbCc ). Le diagramme 
s’ecrit (Fig. 1.4 ) : 


3 : 1 

(A -) (aa) 


D 

O 

C 

=3 

Q 

in 

T 1 

O 

rM 

© 


3 : 1 


(B-) (bb) 



3 : 1 

3 : 1 

(C-) (cc) 

( C- ) (cc) 


phenotype 1 

(A - B - C -) 

phenotype 2 

(A - B - cc) 

phenotype 3 

(A - bb C-) 

phenotype 4 

(aa B - C -) 

phenotype 5 

(A - bb cc) 

phenotype 6 

(aa B - cc) 

phenotype 7 

(aa bb C-) 

phenotype 8 

(aa bb cc) 


3 : 1 

(B-) (bb) 



correspondant a 8 genotypes 
correspondant a 4 genotypes 
correspondant a 4 genotypes 
correspondant a 4 genotypes 
correspondant a 2 genotypes 
correspondant a 2 genotypes 
correspondant a 2 genotypes 
correspondant a 1 genotype 


Figure 1.4 Generalisation du calcul des rapports genetiques dans les hybrides. 
Exemple d ; un triple hybride. 
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On obtient, en effectuant les produits successifs (suivre les fleches 
de haut en bas), le modele 27:9:9:9:3:3:3:1 qui n’est qu’une variante 
combinee du modele 3:1, avec 8 phenotypes et 27 genotypes (Fig. 1.4). 

Avec l’accroissement de genes apparies participant aux croisements 
hybrides, tout en maintenant le principe de segregation independante, 
le nombre de phenotypes et de genotypes devient rapidement tres 
eleve (Tableau 1.3). 

Tableau 1 .3 Nombre de phenotypes et de genotypes en fonction 

DU NOMBRE DE GtNES APPARENT^ DANS LES CROISEMENTS HYBRIDES 


Nombre de genes apparies 

Nombre de phenotypes 

Nombre de genotypes 

1 

2 

3 

2 

4 

9 

3 

8 

27 

4 

16 

81 

- 

- 

- 

n 

2 n 

3" 


1.2 LE MODELE 3:1 CHEZ L'HOMME 

De nombreux caracteres phenotypiques determines par des paires 
d’ alleles chez l’homme sont transmis suivant les memes principes que 
ceux qui ont ete decouverts par Mendel chez le pois. Mais 1’ analyse 
genetique chez I’homme doit evidemment respecter les droits de la 
personne humaine ce qui exclue toute experimentation, c’est pour- 
quoi le geneticien examine les populations humaines naturelles afin 
d’y rechercher les caracteres phenotypiques susceptibles d’etre analyses 
a travers plusieurs generations. Les plus remarquables sont les anoma- 
lies recessives qui apparaissent dans la descendance de personnes ne 
presentant pas elles-memes le phenotype anormal. Une fois l’anomalie 
identifiee, sa transmission est reconstitute dans l’arbre genealogique 
de la famille ou elle est apparue en remontant le plus loin possible 
dans le temps. Un exemple bien connu est fourni par une maladie 
humaine bien etudiee et maitrisee : la phenylcetonurie. 

La phenylcetonurie 

La phenylalanine hydroxylase, premiere enzyme de la voie catabolique 
conduisant de la phenylalanine au fumarate et a l’acetoacetate, cata- 
lyse l’hydroxylation de la phenylalanine en tyrosine (Fig. 1.5). Un 
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deficit en cette enzyme, du a un defaut du gene, s’avere responsable 
de la phenylcetonurie, une maladie genetique humaine assez frequente 
(8 cas pour 100 000 naissances). Elle est due au fait qu’une voie 
secondaire du metabolisme de la phenylalanine est activee en raison 
du deficit en phenylalanine hydroxylase. L’acide amine subit une 
transamination et donne le phenylpyruvate (Fig. 1.5), un compose qui 
s’accumule dans le sang et les tissus et passe avec la phenylalanine 
dans 1’urine, d’ou le nom donne a la maladie. 



Phenylalanine NADH + H + NAD + Tyrosine 


Phenylalanine hydroxylase 


Phenylacetate 



Alanine 


o 

c 

Figure 1 .5 Voie normale du catabolisme de la phenylalanine en tyrosine et voie 
secondaire conduisant au phenylacetate en I'absence d'une phenylalanine 
hydroxylase active. 

© 

Le phenylpyruvate peut etre decarboxyle en phenylacetate qui 
donne une odeur caracteristique a 1’ urine, un signe qui fut jadis utilise 
par les soignants pour detecter la maladie chez le jeune enfant. 
L’accumulation de la phenylalanine et de ses derives au debut de la 
vie perturbe le transport et la disponibilite des autres acides amines ce 
qui altere le developpement normal du cerveau et provoque un retard 
mental severe. La phenylcetonurie fut parmi les premieres anomalies 
genetiques du metabolisme, decouvertes chez Thomme. Quand elle 
est reconnue suffisamment tot, le retard mental peut etre evite par 
un regime alimentaire strict. La consommation d’ aliments riches en 
proteines est proscrite comme celle, par exemple, d’ aliments edulcores 
par 1’ aspartame qui est un dipeptide contenant de la phenylalanine. 
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Afin de foumir a l’enfant un aliment correct, la caseine du lait est hydro- 
lysee en acides amines, et la plus grande partie de la phenylalanine en 
est retiree. Certains biotechnologues envisagent aujourd’hui de creer des 
vaches transgeniques dont les proteines du lait seraient constitutivement 
a faible teneur en cet acide amine. 

Depuis quelques dizaines d’annees, des tests biochimiques (test de 
Guthrie) peu couteux, sont pratiques des la naissance, a partir d’une 
goutte de sang afin de detecter cette maladie, ce qui evite bien des 
soins couteux et beaucoup de detresse. 

Les enfants atteints par cette maladie (phenotype recessif) possedent 
le genotype pp, les autres le genotype PP ou Pp. Generalement cette 
maladie apparait chez des enfants (fille et gar^on, il n’y a pas de 
liaison au sexe) de parents sains (Fig. 1.6 et Fig. 1.7). En effet, puisque 
seuls les enfants porteurs d’alleles recessifs sont atteints, on en deduit 
que les parents sont heterozygotes sains (porteurs sains) et possedent 
chacun un allele recessif. Les genotypes de 1’arbre genealogique 
familial s’ecrivent comme dans la figure 1.6. 

En raison generalement du trop petit nombre d’individus composant 
la famille au regard des croisements experimentaux indispensables 
pour obtenir le rapport genetique mendelien 3:1 caracteristique du 
monohybridisme, il est tres rare que le rapport observe chez 1’homme 
soit correct (dans la figure 1.6, il est de 1:1). Pour connaitre la 
frequence relative des 3 genotypes de cette maladie dans une popula- 
tion humaine en equilibre, il est possible d’utiliser le calcul suivant : si 
la proportion relative des deux alleles P et p est x et y respectivement, 
la frequence des 3 genotypes possibles sera de x 2 pour PP, 2 xy pour 
Pp et y 2 pour pp. Numeriquement pour une frequence d’ homozygotes 
potentiellement malades de y 2 = 1/12500, soit 0,08 %«, la frequence y 
de 1’allele recessif p sera environ de 1/1 12, la frequence x de L allele 
dominant P de 1 1 1/1 1 2 et la frequence des heterozygotes Pp de 2 xy = 
2(1/112) (1 1 1/112) = 1/56. Ce qui signifie que les porteurs sains (Pp) 
sont 220 fois plus frequents que les malades potentiels (homozygotes 
recessifs, pp), une difference qui ne peut aller qu’en augmentant dans 


a) 



b) 


Pp 


Pp 


P- pp pp P- 


Figure 1 .6 Descendance de parents sains porteurs heterozygotes d'une anomalie 
genetique. a) Cas general ; b) application a la phenylcetonurie. 
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0 
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i 


Avortement ou mort-ne 
de sexe inconnu 



Determination de la 
personne etudiee 



Vrais jumeaux 
(monozygotiques) 



Methode d’identification 
d’une personne dans 
une genealogie. 

Ici, 2 e enfant de la 
ll e generation ou 11.2 
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Figure 1 .7 Symboles utilises dans I'analyse genealogique. 


les generations successives et qui souligne finalement la rarete de 
1’allele p. A l’inverse, les unions consanguines accroissent le risque de 
naissance d’un enfant malade particulierement si les ancetres des 
parents sont heterozygotes (Fig. 1.8). Cet exemple, qui peut etre gene- 
ralise (la mucoviscidose ou Falbinisme sont deux autres exemples bien 
documentes), illustre pourquoi les mariages entre personnes apparen- 
tees, cousins par exemple, augmentent la frequence des maladies 
recessives dans les populations humaines (voir aussi chapitre 8). 

Cependant, grace aux progres de la genetique moleculaire et des 
techniques d’identification des genes et de leurs mutations, la predic- 
tion du risque d’ anomalies genetiques liees notamment aux alleles 
recessif s s’avere de plus en plus precise et precoce. II existe chez 
1’homme egalement des maladies genetiques transmises selon un 
mode dominant (par exemple la choree de Huntington). Dans ces cas, 
1’allele normal est recessif et c’est 1’allele anormal, mute, qui est 
dominant. La maladie (ou le desordre genetique) peut alors apparaitre 
a chaque generation et il est de ce fait en theorie possible de prevoir et 
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Figure 1.8 Genealogie d'une famille ou deux enfants sont atteints de phenyl- 
cetonurie (homozygotes recessifs pp) a la suite du mariage consanguin entre des 
cousins dont les ascendants sont heterozygotes. 


d’eviter sa transmission. De tels alleles dominants defectueux 
peuvent egalement resulter de mutations spontanees au moment de la 
formation des gametes ou provoquees par des conditions environne- 
mentales particulieres (par exemple : a la suite d’une irradiation 
radioactive ou d’une exposition a un agent mutagene). La personne 
concernee peut ne pas en subir immediatement les consequences sauf 
en general si l’evenement se produit a un stade embryonnaire 
precoce. Mais elle peut transmettre la mutation a sa descendance si sa 
lignee germinale (gametes) est atteinte. 

La perception de I'amertume par I'homme 
et les grands singes 

II est banal de constater de discretes differences morphologiques entre 
deux individus de la meme espece, meme tres proches genetiquement. 
Elies ne peuvent pas etre pour autant attributes a des anomalies gene- 
tiques. Dans l’espece humaine, elles sont a la base des processus de 
reconnaissance entre les individus. Dans toutes les especes, ces 
phenotypes normaux, mais differents, constituent ce que le geneticien 
appelle le polymorphisme. Dans une version simplifiee, les alleles de 
plusieurs genes portes notamment par les chromosomes X et Y sont 
impliques. On parle de dimorphisme entre les individus de sexe male 
ou femelle (dimorphisme sexuel). 

Le polymorphisme peut aussi se presenter sous une forme cachee. 
C’est le cas par exemple dans la capacite des humains et des grands 
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singes a percevoir le gout amer d’une substance chimique de synthese, 
le phenylthiocarbamide (PTC) qui contient le groupe chimique (N-C=S). 
Certains individus pergoivent une amertume tres desagreable, alors 
que d’autres ne pergoivent rien du tout. La region genomique, en cause 
chez 1’homme, contient le gene TAS2R38 qui code l’un des multiples 
recepteurs du gout amer. Cinq alleles (haplotypes) resultant de la 
presence de 3 mutations ponctuelles dans la region codante produisent 
differents recepteurs qui expliquent completement la distribution 
bimodale de la sensibilite ou non au PTC. Conduit au sein de diffe- 
rentes families, un test sensoriel montre, sur la base d’une transmission 
de type mendelien, que deux parents sensibles peuvent avoir des 
descendants insensibles (Fig. 1.9). II en resulte que V allele principal 
(l’haplotype) de sensibilite est dominant, et ceux de l’insensibilite, 
recessifs. Bien qu’aucun des deux phenotypes n’ait une valeur selective 
clairement identifiee, leur apparition chez l’homme et le chimpanze 
resulterait d’evenements mutationnels totalement independants. 


D 

O 

C 

=3 

Q 

in 

T 1 

O 

r\j 

© 



] (^) Sensibles (SS ou Ss) 

| (J) Insensibles (ss) 

Figure 1 .9 Genealogie d'un dimorphisme humain : I'aptitude a percevoir ou non 
I'amertume du phenylthiocarbamide (PTC). 


1.3 DOMINANCE ET RECESSIVITE, MULTIALLELISME 
Aspects generaux 

La notion de dominance d’un allele s’ oppose a celle de recessivite. 
Elle resulte directement de l’etat diploide des metazoaires (individus 
pluricellulaires engendres au sein d’une espece par reproduction sexuee). 
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Ces organismes possedent dans chacune des cellules de leur corps une 
copie de chaque chromosome en provenance de l’un et 1’ autre des 
parents. Les deux chromosomes parentaux, dits homologues, portent 
ainsi la meme serie de genes. Pour un gene donne, 1’ allele paternel 
peut differer cependant de l’allele maternel, et inversement. L’un des 
alleles est dit mute, comparativement a 1’ autre. Si les deux alleles 
portes par un individu sont identiques, le phenotype qu’ils influencent 
sera en general exprime. S’ils sont differents, le phenotype de l’indi- 
vidu, dit alors heterozygote, depend de l’allele qui est dominant. L’ autre 
allele, dit recessif, peut correspondre a un phenotype particulier qui 
ne sera pas exprime. On dit qu’il est reprime. II s’agit d’un cas de simple 
dominance. Tout au long de la descendance de V individu heterozygote, 
le trait phenotypique qui depend de 1’ allele dominant sera exprime a 
chaque generation, alors que ce n’est pas le cas pour le trait pheno- 
typique qui depend de V allele recessif. Un descendant ne peut exprimer 
le phenotype « recessif » que, si les deux alleles sont recessif s et 
identiques (etat homozygote). 

La dominance de 1’ allele sera dite incomplete si le phenotype de 
reference, dit de type sauvage (parce que le plus repandu dans la 
population naturelle) depend de la presence des deux alleles, dits aussi 
de type sauvage. La presence d’un seul allele sauvage peut conduire a 
un phenotype intermediate, d’ou le terme de dominance incomplete. 
II arrive parfois que l’allele mute, generalement recessif, influence 
cependant 1’ expression du phenotype dependant de 1’ autre allele. Cela 
peut se produire par exemple si la proteine produite par 1’ allele mute 
inhibe par competition la proteine produite par 1’ allele sauvage. On 
parle alors de dominance negative. Ce phenomene s’observe tres 
souvent lorsqu’un phenotype depend d’un complexe proteique fonc- 
tionnel compose de plusieurs sous-unites (enzymes ou recepteurs de 
voies de signalisation, voir ci-dessous) 

Le terme de co-dominance designe la situation ou les deux alleles 
de type sauvage ou non expriment simultanement et avec une « force » 
comparable deux phenotypes distincts (voir egalement ci-dessous). 

Deux exemples : groupes sanguins et tyrosinase 

II arrive frequemment qu’un gene au sein d’une population possede 
un nombre eleve d’alleles differents. Un individu diploide de cette 
population n’est par definition porteur que de deux exemplaires du 
gene, c’est-a-dire deux alleles seulement (identiques ou differents). 
C’est l’examen de differents individus de la meme population qui revele 
en general ce multiallelisme. On dit que la collection des differents 
alleles constitue une serie allelique. Un exemple simple en est donne 
par les alleles des groupes sanguins humains ABH (0). 
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Dans le systeme ABH, on connatt quatre phenotypes ( Tableau 1.4) 
et trois alleles principaux (7 s , I A et /). Chaque etre humain possede 
seulement 1 (en double exemplaire) ou 2 alleles parmi les 3 possibles. 
Les alleles I A et I B determinent la synthese a la surface des cellules 
(hematies) d’un antigene unique. L’allele i correspond a l’absence de 
synthese de l’un des 2 antigenes precedents. Les alleles I A et 7 s sont 
dominants lorsqu’ils sont associes a i, et codominants dans le geno- 
type I A I B . 


Tableau 1.4 Groupes sanguins ABH humains. 


Groupe (phenotype) 

Genotype 

H (0, ni A, ni B) 

ii 

A 

l A l A ou l A i 

B 

l B l B ou l B i 

AB 

l A ,B 


Un autre exemple est fourni par le gene C des mammiferes. II code 
une enzyme, la tyrosinase, qui intervient dans la synthese des 
pigments (melanines) de la robe. Les differents alleles produisent des 
phenotypes variables allant du noir (synthese pleinement active) a 
1’ absence de pigments (albinisme) en passant par la serie des gris 
(synthese plus ou moins active). 

Les relations de dominance/recessivite entre les alleles d’une serie 
sont parfois complexes, tel allele pouvant etre a la fois dominant et 
recessif suivant 1’ autre allele avec lequel il est combine chez un indi- 
vidu diploi'de. L’allele le plus frequemment rencontre dans une popula- 
tion naturelle sera generalement appele allele de type sauvage. Chez les 
vegetaux, le multiallelisme est parfois impressionnant pouvant aller 
pour certains genes particuliers, jusqu’a plusieurs centaines d’alleles. 

Denommer les alleles n’est done pas toujours simple, de sorte que 
les symboles employes par les differents laboratoires peuvent varier. 
Des efforts d’ harmonisation de la nomenclature sont cependant accom- 
plis par les differentes communautes scientifiques regroupees dans 
l’etude de quelques organismes modeles. 

1.4 ALLELES LET AUX 

Un exemple de ce type d’ allele a ete analyse par Lucien Cuenot, un 
geneticien fran^ais du debut du xx e siecle. Des souris a pelage clair 
(jaunatre) naissent parfois de parents a pelage de type sauvage (on parle 
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d’un phenotype « agouti » le poil sauvage etant de couleur noire avec 
une bande jaune, due a l’expression transitoire du gene A (pour 
« Agouti »). Croises entre eux, les individus FI a pelage clair donnent 
une descendance composee toujours aux 2/3 d’individus « jaunes » et 
pour 1/3 d’individus de type sauvage, alors que le rapport mendelien 
attendu serait de 1 :2: 1 . 

Lucien Cuenot a propose qu’un allele A Y , responsable de la couleur 
claire (y pour yellow : jaune) soit dominant sur 1’allele sauvage A. A 
l’etat homozygote, l’allele A Y serait de plus letal ( A Y A Y ). Les individus 
de ce type ne seront done pas comptabilises dans la descendance du 
fait de leur mort precoce in utero. Ainsi, dans le croisement des FI 
( AA Y x A Y A) le rapport devient bien 2/3 A Y A (« jaune ») et 1/3 AA 
(« sauvage »), apres elimination des embryons A Y A Y c’est-a-dire le 
rapport observe. De plus, des souris de phenotype sauvage (genotype 
AA) croisees avec des souris de phenotype « jaune » ( A Y A ) donneront 
toujours une descendance a 50 % de phenotype sauvage et 50 % de 
phenotype « jaune ». 

On dit d’un gene qui induit des effets distincts (ici pelage clair et 
viabilite) qu’il est pleiotrope. Le gene Agouti murin possede d’autres 
alleles qui confirment ce phenomene. Par exemple, 1’ allele A VY (viable 
et jaune) donne un pelage clair et des souris obeses. On doit remar- 
quer cependant que les phenotypes peuvent dependre de la concentra- 
tion de la proteine puisque le gene A Y par exemple est letal a l’etat 
homozygote (double dose) mais pas a l’etat heterozygote (simple 
dose). Plus recemment on a decouvert que 1’ expression du gene 
Agouti est controlee par des mecanismes epigenetiques lies a des 
niveaux variables de methylation de certaines regions de l’ADN, 
regulatrices de la transcription du gene (voir chapitre 5). 

1.5 ACTUALITE DU CONCEPT DE GENE 
Un concept historique 

Dans les annees 1860, Gregor Mendel suggere pour la premiere fois 
(voir plus haut), 1’existence de « facteurs » transmissibles des parents 
a leurs descendants. Bien que le terme meme de gene soit invente plus 
tard, il explique ses resultats en termes d’heredite des caracteres, fait 
1’hypothese de leur assortiment independant, distingue les traits domi- 
nants et recessifs, formule l’existence d’ heterozygote et d’homozygote, 
avance ce qui ulterieurement sera defini comme le genotype et le 
phenotype. En 1 889, le terme de « pangene », abrege vingt ans plus 
tard en « gene », est invente par Hugo de Vries qui, tout en ignorant 
les travaux de Mendel, designe par ce mot la plus petite particule 
correspondant a une caracteristique hereditaire. En 1910, Thomas 
Morgan montre que les genes sont portes par les chromosomes, ou ils 
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occupent des positions specifiques ; il cree avec ses eleves la premiere 
carte chromosomique de la drosophile. En 1928, Frederick Griffith 
demontre que les genes peuvent se transmettre : des bacteries patho- 
genes pour la souris, bien que tuees par la chaleur, peuvent transmettre 
une information genetique et transformer d’autres bacteries, vivantes 
mais non pathogenes, au point de les rendre capables de tuer a leur 
tour des souris. En 1 944, Oswald Theodore Avery, Colin McLeod et 
Maclyn McCarty montrent que le principe chimique transformant les 
bacteries est l’ADN (Acide DesoxyriboNucleique), et non les proteines 
comme cela etait 1’hypothese dominante. Ils etablissent que l’ADN 
est le support de l’heredite. En 1953, en se basant sur les travaux de 
cristallographie de Rosalind Franklin, James D. Watson et Francis 
Crick etablissent la structure en double helice de 1’ ADN. Cette decou- 
verte majeure apporte pour la premiere fois une explication strictement 
physico-chimique a la notion d’ information genetique et a sa trans- 
mission de generation en generation. Dans une phrase devenue celebre, 
les deux auteurs indiquent en effet, a la fin de leur article fondateur : 
« II ne nous a pas echappe que l ’appariement specifique postule suggere 
du me me coup, un possible mecanisme de reproduction du materiel 
genetique. » Ils anticipaient, ce qui fut ulterieurement demontre, que 
chaque brin de l’ADN apres separation, servait de matrice pour la 
synthese d’un brin complementaire, et qu’a partir d’une molecule 
d’ADN on pouvait en obtenir deux, ce qui est la marque meme du 
principe de la reproduction et de la transmission physique, via un 
support materiel, des instructions genetiques caracteristiques de chaque 
etre vivant. 

d 

Pour la plupart des biologistes, la notion de gene, qui etait alors 
consideree comme un concept plutot abstrait, devint du coup une 
realite physique isolable et manipulable. Le gene se definit alors 
comme une unite chimique hereditaire, codee dans une sequence de 
nucleotides, ces derniers etant eux-memes, organises en de longs brins 
d’ADN, constitutifs des chromosomes. Un gene ainsi defini, peut adopter 
de multiples formes differentes (les alleles du gene) correspondant a 
differentes sequences nucleotidiques tres proches les unes des autres, 
et done apparentees. Apres avoir ete converties en ARN messagers, 
ces sequences d’ADN sont a 1’origine de la construction des proteines 
correspondantes, dans le respect du principe qu’a un gene correspond 
au moins une proteine. 

Pour de nombreux biologistes, cette vision devenue historique et 
conventionnelle reste acceptable, a quelques details pres. Pour un 
nombre grandissant de geneticiens, il ne s’agit la que d’une approxima- 
tion cachant une realite bien plus complexe (voir chapitre 5, ENCODE). 
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Un concept dynamique 

Au cours des demieres decades en effet, des decouvertes sur la maniere 
dont les informations genetiques associees a la sequence de l’ADN 
assurent le fonctionnement des etres vivants ont revolutionne en la 
complexifiant la vision traditionnelle du concept de gene. Contrairement 
au fonctionnement des genes procaryotes, a l’origine du principe « un 
gene, une proteine », on a decouvert, en premier lieu, que la sequence 
codante des genes eucaryotes est discontinue, en quelque sorte dispersee 
au sein de regions non codantes. Le concept de gene morcele d’une 
part en exons (parties codantes) generalement de petite taille et d’autre 
part en introns de plus grande taille (parties non codantes) en resulta. 
Pour reconstituer un ARN messager, apte a diriger la synthese des 
proteines, les transcrits primaires d’un tel gene sont episses, grace a 
un mecanisme qui elimine les introns et reconstitue une sequence 
codante continue. Les nombreuses variantes d’un tel mecanisme 
aboutissent a differents ARN messagers alternatifs et finalement a la 
synthese de plusieurs proteines differentes. Contrairement a la vision 
classique un seul gene peut done engendrer plusieurs proteines diffe- 
rentes grace a un epissage alternatif (voir le Mini Manuel Biologie 
moleculaire dans cette collection). 

Un degre de complexity supplemental fut revele avec 1’ existence 
de genes dont les sequences sont chevauchantes (des exons et introns 
sont communs a plusieurs genes et d’autres non). Autres elements 
plus recents de complexifi cation, des genes sont places parfois a 
l’interieur d’introns d’autres genes ; des transcrits provenant de 
regions genomiques distinctes se recombinent en une seule molecule 
d’ARN prealablement a leur traduction. Le developpement des 
connaissances portant sur des genomes entiers revele que de tres 
nombreux transcrits sont synthetises sans qu’ils soient ensuite traduits en 
proteines. II s’agit d’ARN non codants. Correspondent-ils a des genes 
au sens traditionnel du mot ? Ces decouvertes attestent qu’un grand 
nombre d’informations, peut-etre majoritaires, et apparemment indis- 
pensables a la formation et au fonctionnement des etres vivants, tran- 
sient par des transcrits ARN et non par des proteines (Fig. 1. 10). Plus 
etonnant encore, certains ARN associes a des phenotypes clairement 
identifiables, semblent etre transmis de generation en generation, 
independamment des « genes » dont ils sont issus (voir chapitre 2, la 
notion de paramutation). 

Aussi, a la question « Qu’est-ce qu’un gene ? », la reponse a ce 
jour s’avere tres incertaine. On pourrait dire d’une fagon certes un peu 
vague, qu’il s’agit « d’une region definie de la molecule d’ADN, 
correspondant a une unite hereditaire, localisable au sein d’une sequence 
genomique, et qui se trouve associee a des regions regulatrices, des 
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regions transcrites et d’autres regions fonctionnelles » (voir chapitre 5, 
ENCODE et Mini Manuel de Biologie moleculaire ). 



Figure 1 .10 Schema illustrant la complexity d'une region genomique contenant 
des sequences codant des proteines et des sequences produisant des ARN non 
codants. 

Les transcrits derivent de I'un ou I'autre des deux brins d'ADN. Ms sont parfois chevau- 
chants ou recombinants. Certains, y compris les transcrits non codants sont alternati- 
vement episses. A la fois les exons et les introns peuvent transmettre des informations 
genetiques. De nombreux microARNs et autres petits et longs ARN derivent des 
introns et regions intergeniques chez les animaux. II semble que leurs typologies et 
leurs fonctions soient essentielles pour les etres vivants. 

1 — I 
O 
rsi 

Malgre le flou d’une telle definition, il n’en demeure pas moins que 
le concept (la notion ou l’objet) sous-jacent au terme de « gene » reste 
d’un emploi commode pour designer les entites genetiques transmises 
de generation en generation. 
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Chapitre 1 • Elements de genetique mendelienne 



POINTS CLEFS 


> L'interet fondateur du travail de G. Mendel, est d'avoir aborde I'etude de la 
variation des caracteres entre parents et descendants, en limitant le nombre 
des caracteres, en choisissant un modele biologique peu sensible aux 
conditions de I'environnement, et surtout en adoptant une demarche 
d'analyse quantitative simple, consistant a compter a chaque generation 
les individus qui presentent le caractere selectionne par I'experimentateur. 

> Les trois principes ou « lois » de Mendel sont : la « loi » de dominance (qu'il 
n'avait pas formulee !), la « loi » de disjonction des caracteres et la « loi » de 
segregation independante des caracteres. En raison de nombreuses excep- 
tions, la loi de dominance fut tres vite abandonnee, celle de la segregation 
independante contestee et la « loi de purete des gametes », rencontra cer- 
taines exceptions. Le modele de Mendel reste une reference, car la plupart 
des exceptions n'affectent que ('expression des genes, non les regies de 
transmission. 

> Un gene peut exister sous differentes formes denommees alleles (ou allelo- 
morphes, formes alternatives). Un individu, ne de la fusion des gametes 
(ovule et spermatozoide), regoit deux lots de genes « equivalents » I'un 
maternel, I'autre paternel, formant un seul ensemble de genes (paires de 
genes). 

> Gene et allele sont deux termes associes dans une relation proche de celle 
qui reunit par exemple les termes genre et espece. Un gene peut avoir de 
nombreux alleles, etun allele se rapporte toujoursa un gene. 

> Dans une population formee de nombreux individus, un gene donne pourra 
se presenter sous la forme de nombreux alleles. Mais chez un individu on 
ne trouvera au mieux que 2 alleles distincts (individu heterozygote) ou 
meme un seul si I'individu est homozygote. 

> La notion de dominance d'un allele s'oppose a celle de recessivite. Elle 
resulte directement de I'etat diploide des metazoaires. L'allele domi- 
nant impose le phenotype. 

> Les relations de dominance/recessivite entre les alleles d'une serie sont 
parfois complexes, tel allele pouvant etre a la fois dominant et recessif 
suivant I'autre allele avec lequel il est combine chez un individu diploide. 
L'allele le plus frequemment rencontre dans une population naturelle sera 
generalement appele allele de type sauvage. 

> On dit d'un gene qui induit des effets multiples qu'il est pleiotrope. 

> Les alleles letaux modifient les rapports mendeliens attendus. 

> La structure en double helice de I'ADN est une decouverte majeure qui a 
apporte pour la premiere fois une explication strictement physico-chimique 
a la notion d'information genetique et a sa transmission de generation en 
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generation. A partir d'une molecule d'ADN on peut en obtenir deux,ce qui 
est la marque meme du principe de la reproduction et de la transmission 
physique, via un support materiel, des instructions genetiques caracteristiques 
dechaqueetre vivant. 

> A la question « Qu'est-ce qu'un gene ? », la reponse s'avere encore aujourd'hui 
tres incertaine. On peut avancer qu'il s'agit « d'une region definie de la 
molecule d'ADN, correspondant a une unite hereditaire, localisable au 
sein d'une sequence genomique, et qui se trouve associee a des regions 
regu lattices, des regions transcrites et d'autres regions fonctionnelles ». 


QCM - QROC 


1.1 Qu’appelle-t-on genotype ? 

1.2 Qu’appelle-t-on phenotype ? 

1 .3 Quelle est la bonne affirmation ? 

a) Un allele est une forme particuliere d’un gene. 

b) Un allele est un gene obligatoirement mute. 

c) Un allele est la forme proteique d’un gene. 

1 .4 Quelle est la reponse la plus acceptable a la question « Qu’est-ce 
qu’un gene » ? 

a) Une sequence d’ADN codant une proteine. 

b) Un concept theorique commode sans realite physique. 

c) Une entite chimiquement variable porteuse d’une information trans- 
missible. 

d) Une region definie de la molecule d’ADN, correspondant a une 
unite hereditaire, localisable au sein d’une sequence genomique, et 
qui se trouve associee a des regions regulatrices, des regions transcrites 
et d’autres regions fonctionnelles. 

1.5 Des jumeaux bivitellins (issus de deux ovules distincts) sont 
engendres par un couple, tous deux heterozygotes ( Aa ) pour 1’ allele a 
recessif de l’albinisme. Quelle est la probability pour que les jumeaux 
possedent le meme phenotype de pigmentation (presence ou absence 
de pigmentation) ? 

V 

1 .6 A partir de l’arbre genealogique presente dans la figure 1 .9, peut- 
on dire que l’incapacite a percevoir l’amertume du phenylthio- 
carbamide est un caractere dominant ? Donner le genotype des indivi- 
dus II. 1 et II. 2. 
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1.7 Qu’elle est la probability pour que le premier enfant d’un couple 
sain soit atteint de phenylcetonurie, sachant que l’homme a une soeur 
atteinte et la femme, son frere ? 

1.8 La dystrophie musculaire de Duchenne, une maladie liee au 
chromosome X, est une grave myopathie qui touche les gar^ons 
seulement. Quelle est la probability, pour qu’une femme dont le frere 
est atteint ait un enfant malade ? 

1 .9 L’intensite de coloration du pelage est regie par une serie plurial- 
lelique chez la souris. L’allele C (couleur normale) domine l’allele c 
(couleur pale) qui lui-meme domine 1’ allele c l (letal recessif). On 
realise le croisement Cc 1 x cc 1 , puis les individus obtenus (genera- 
tion Fl) sont croises avec des individus cc 1 . Donner a la generation F2 
les pourcentages respectifs des individus de couleur normale et des 
individus de couleur pale et dans ces deux populations les pourcen- 
tages des individus porteurs de V allele c l . 


REPONSES 


1.1 C’est la partie du genome d’un individu qui participe a la deter- 
mination d’une caracteristique specifique, d’un trait phenoty pique, de 
cet individu. 

1.2 Le phenotype d’un individu fait reference a son apparence 
physique generate et a son organisation mais aussi a 1’ aspect particulier 
d’un trait variable, comme la couleur des yeux, le comportement, ou 
une caracteristique metabolique observable entre les individus d’une 
espece. 

1.3 a) 

1.4 d) 

1 .5 La probability que se produise l’un ou 1’ autre de deux evenements 
independants (qui s’excluent mutuellement) est la somme de leurs 
probabilites individuelles. Puisque les genotypes des deux parents est 
Aa ( A , allele sauvage dominant responsable de la pigmentation et a, 
allele recessif de 1’albinisme, absence de pigmentation), la probability 
du phenotype de pigmentation pour les deux jumeaux bivitellins est 
de 3/4 x 3/4 = 9/16, et celui de l’absence de pigmentation (albinisme) 
de 1/4 x 1/4 = 1/1 6. La probability que se produise l’un ou l’autre sera 
done de : 9/16 + 1/16 = 10/16 soit 5/8. 
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1.6 Le caractere est recessif, car II. 1 et II.2 sensibles a l’amertume 
ont un enfant insensible. Ils sont done heterozygotes Ss. 

1 .7 Comme le caractere est porte par le chromosome autosome HS A 
1 2 les deux parents peuvent etre porteurs sains ou homozygotes domi- 
nants. Au vu de leur genealogie, ils doivent etre heterozygotes. La 
probability qu’ils presentent chacun cet etat est de 2/3 et la probability 
qu’ils presentent cet etat simultanement est de 2/3 x 2/3 = 4/9. Un 
quart de leurs enfants sera atteint de phenylcetonurie. La probability 
combinee qu’ils soient heterozygotes et que leur premier enfant soit 
atteint de phenylcetonurie, est de 4/9 x 1/4 = 4/36 soit 1/9. 

1 .8 Puisque le frere est atteint cela signifie que leur mere qui n’est pas 
malade transmet cependant la maladie et possede le genotype X A X a , 
avec X a designant 1’ allele defectueux. On suppose que son compagnon 
est sain et possede done le genotype X A Y. La probability de chaque 
allele etant de 1/2, la probability du genotype malade X a Y sera de 1/4, 
et celle qu’un enfant le soit de 1/4 x 1/2 = 1/8. 

1.9 A la FI suite au croisement Cc 1 x cc 1 , on obtient des indi vidus de 
genotypes : Cc, Cc 1 et cc 1 (pas d’ homozygote c l c l car letal). La F2 
resultera des croisements suivants : 

- Cc x cc 1 ; genotypes des descendants : Cc, Cc 1 , cc et cc 1 

- Cc 1 x cc 1 ; genotypes des descendants : Cc, Cc 1 et c l c 

- cc 1 x cc 1 ; genotypes des descendants : cc, cc 1 et c l c. 

On aura 40 % d’ indi vidus de couleur normale dont la moitie porte 
l’allele c l et 60 % d’individus de couleur pale dont 2/3 portent 
1’ allele c l . 
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2.1 Origine des mutations 

2.2 Les differents types de mutations modifiant ou non la fonction 

2.3 La notion de paramutation 

2.4 Effets des mutations 

2.5 La notion de selection 

2.6 La distinction entre phenotype et genotype 

2.7 Liaison genetique et desequilibre de liaison 

2.8 Herediteet heritabilite 



Etudier I'origine et le role des mutations 

Etablir les relations entre mutations et selection 

Eclairer la notion de desequilibre de liaison 

Distinguer la part respective des genes et de I'environnement 


2.1 ORIGINE DES MUTATIONS 

Pour survivre et se reproduire, les organismes vivants doivent repliquer 
fidelement leur ADN et le proteger des deteriorations physico-chimiques. 
En effet, des mutations chez 1’homme peuvent par exemple deregler le 
controle strict de la division cellulaire, entrainer la proliferation continue 
de certaines cellules et former une tumeur cancereuse. De la meme 
maniere si les mutations concernent l’ADN du spermatozoide ou de 
1’ ovule des parents, des maladies genetiques peuvent en resulter chez 
1’ enfant. Des mecanismes moleculaires de correction et de reparation 
des defauts de l’ADN minimisent ces risques et agissent a 1’ instar de 
filtres, certes imparfaits, pour eliminer les dommages causes a 1’ ADN 
par les erreurs de replication ou les agents mutagenes apportes par les 
nuisances environnementales. 
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a I’antibiotique 

Figure 2.1 Mise en evidence des mutations spontanees. 

Lesquatre cultures de la meme souche bacterienne sont propagees un grand nombre 
de fois dans un milieu liquide complet puis on realise a partir de chacune de ces quatre 
cultures un etalement d'un nombre identique de bacteries sur milieu complet solide 
en boite de Petri (A) contenant une meme concentration d'un antibiotique puissant. 
Le nombre aleatoire de bacteries mutantes dans chaque culture (B) revele le caractere 
spontane et aleatoire des mutations de I'ADN bacterien conferant une resistance a 
I'antibiotique. Des etalements temoins, non represents ici, realises sur des boites de 
Petri depourvues d'antibiotique donnent pour chacune des cultures apres 48 h d'incu- 
bation un nombre eleve et similaire de colonies.Ceci permet de verifier que le nombre 
de bacteries presentes dans les quatre cultures est bien comparable et qu'aucun 
defaut metabolique dans la croissance des bacteries ne vient perturber I'analyse. 
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II faut admettre cependant que si l’ADN etait absolument invariant, 
c’est-a-dire replique avec une fidelite absolue et done depourvu totale- 
ment de mutations, 1’ evolution des especes vivantes a 1’ origine de ce 
que Ton nomme la biodiversite ne serait pas cette realite admise par 
tous aujourd’hui. Les deteriorations ou les rearrangements de sequence 
de l’ADN d’un individu a un instant donne sont done le resultat de la 
balance qui s’etablit entre les evenements de mutations et de rearrange- 
ments et l’efficacite des mecanismes de reparation de ces alterations. 
Les taux de mutations varient selon les especes. Dans certaines condi- 
tions, un taux eleve de mutations peut permettre a certains organismes 
d’evoluer avec rapidite et done de s’ adapter plus efficacement a leur 
environnement. Un exemple particulierement eclairant est foumi par les 
mutations bacteriennes entrainant 1’ apparition de resistance aux anti- 
biotiques (Fig. 2.1, principe du test de Ames). 

Les mutations liees a des erreurs de duplication de I'ADN 

Les mutations les plus simples portent sur la modification d’une base 
seulement. Ce sont les transitions et les transversions (Fig. 2.2). On 
les nomme aussi mutations ponctuelles. Elies sont a V origine de la 
notion de polymorphisme d’un seul nucleotide (SNP pour Single 
Nucleotide Polymorphism). A ce type de mutations se rattachent aussi 
les insertions ou les deletions d’un seul nucleotide. Le changement de 
position d’un atome d’hydrogene dans une base (tautomerisation) 
peut conduire egalement a de faux appariements et a des changements 
de base au deuxieme cycle de replication (Fig. 2.3). Les autres modi- 
fications portent sur des fragments d’ADN de taille plus importante. 
Elies sont engendrees generalement par des evenements de recombi- 
naison ou de transposition qui se rangent parfois dans la categorie 
des mutations chromosomiques. 

T 1 

O 

rq 



Transition 



A 

\ 

\ — 

G 



T 


C 


purine ^ — ► 

pyrimidine < — ► 
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Figure 2.2 Changements de bases pyrimidiques ou puriques par transition ou 
transversion. 
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Sous sa forme ponctuelle, la mutation necessite deux cycles successifs 
de replication pour se fixer. Elle prend son origine dans l’un des 12 appa- 
riements incorrects possibles, lors du premier cycle de replication de 
l’ADN. Elle ne devient effective qu’au deuxieme cycle de replication 
au cours duquel l’appariement incorrect engendre un changement 
definitif dans l’une des molecules-filles d’ADN (Fig. 2.3). 

Les taux de mutations varient enormement d’une espece a une autre. 
Des taux eleves peuvent permettre dans certaines circonstances a un 
organisme de faire face a un changement environnemental rapide 
(Fig. 2.1). 

La frequence des mutations quel que soit leur type varie de 10 -6 a 
10 _ 11 par cycle de replication de l’ADN avec des regions chromoso- 
miques parti culierement instables ou la frequence est tres elevee. Elies 
sont nominees pour cela points chauds de mutations. 

II faut ranger dans cette categorie les sequences repetees de deux a 
quatre nucleotides, appelees microsatellites. Ce sont des repetitions 
de bases cytosine et adenine sur un brin d’ADN qui s’ecrivent (CA) W 
ou en sens inverse sur 1’ autre brin (TG)„. Lors de la replication de ces 
microsatellites, des derapages de la machinerie de duplication se 
produisent frequemment, entrainant des variations dans le nombre n 
de repetitions effectivement copiees. Pour un microsatellite donne, il 
est done frequent d’ observer parmi les indi vidus d’une meme espece, 
un fort polymorphisme du nombre de repetitions (e’est-a-dire de la 
taille du microsatellite). Compte tenu du nombre tres eleve (plusieurs 
centaines de milliers) de microsatellites dans le genome des eucaryotes, 
notamment chez l’homme, le choix approprie de certains d’entre eux et 
la combinatoire qui en decoule dans leur polymorphisme de longueur, 
constitue un moyen technique efficace pour caracteriser tout individu de 
1’ espece concemee. C’est la technique dite des empreintes genetiques 
largement utilisee dans les demarches d’ identification des personnes 
et de leurs caracteristiques genetiques. 

Les mutations provoquees par des agents mutagenes 

Outre les erreurs spontanees de replication, les mutations sont parfois 
le resultat de deteriorations de l’ADN provoquees par des agents 
mutagenes divers. Les radiations ionisantes et ultraviolettes, certaines 
substances chimiques (agents alkylants, methylants, intercalants) sont 
en cause. 

L’ hydrolyse spontanee des groupes NH 2 de la cytosine ou de la 
5-methyl-cytosine donne naissance respectivement a l’uracile et a la 
thymine. Elies s’apparieront alors apres un cycle de replication avec 
1’ adenine et non plus avec la guanine creant ainsi une mutation 
ponctuelle. 
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Reparation 


5'- AGTCGTTA -3' 
3'- TCAGCAAT -5' 


ADN parental 


AGTC C TTA 

TCAGqAAT 


1 er cycle 
de replication 



AGTCGTTA 

TCAGCAAT 


AGTCCTTA 

TCAGGAAT 


2 e cycle de 
replication 


AGTCGTTA AGTCGTTA 
TCAGCAAT TCAGCAAT 



AGTCGTTA 

TCAGCAAT 


ADN fils mute ADN fils de type parental 

Figure 2.3 Deux cydes de replication sont necessaires pour qu'une mutation 
ponctuelle soit definitivement introduite dans une region de I'ADN fils. 

L’hydrolyse spontanee de la liaison N-glycosidique unissant les 
bases puriques au desoxyribose cree des pseudo-nucleotides sans 
guanine ou adenine, dits apuriniques qui bloquent la replication. 

Le transfert par alkylation de groupes ethyl (comme le ALethyl-A- 
nitrosouree ou ENU) ou methyl (comme l’ethyl-methanesulfonate ou 
EMS) sur les bases puriques ou pyrimidiques cree sou vent des bases 
ethylees ou methylees dont Fappariement naturel est modifie. C’est 
particulierement le cas de la 0 6 -methylguanine qui peut s’apparier 
avec la thymine ce qui provoque a la replication un changement de 
paires G-C en paires A-T. 

Les radicaux libres tels O 2 ou OH- engendres a partir de l’oxygene 
par les radiations ionisantes ou certains agents chimiques attaquent 
I’ADN et provoquent des « adducts » transformant les bases ciblees 
en sites hautement mutagenes. 

C’est le cas de la 7,8-dihydro-8-oxoguanine (oxoG) qui peut s’appa- 
rier aussi bien avec la cytosine que 1’ adenine, provoquant dans ce 
dernier cas une des mutations par transversion les plus frequemment 
rencontrees a 1’ origine de certains cancers humains. 

La lumiere ultra violette de longueur d’onde voisine de 260 nm 
(proche UV) est fortement absorbee par les purines et pyrimidines, en 
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raison de leur systeme de doubles liaisons conjuguees. Cela peut provo- 
quer tout particulierement la fusion photochimique de deux thymines 
adjacentes et donner un dimere de thymine (Fig. 2.4 ) qui ne peut pas 
efficacement s’apparier avec les adenines complementaires ce qui 
bloque l’ADN polymerase lors de la replication. 

Les radiations ionisantes (rayons y et rayons X), seules ou associees 
a des agents eux-memes ionisables en especes reactives, provoquent 
des cassures aleatoires de la double helice d’ADN qui conduisent 
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Figure 2.4 Formation et structure d'un dimere de thymine. 
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souvent a la mort cellulaire. Bien maitrise, leur emploi therapeutique 
sert a limiter la proliferation des cellules tumorales dans le traitement 
de certains cancers. 

Constitues de molecules polycycliques, les agents intercalants 
(ethidium, acridine orange, proflavine) ont des formes aplaties mimant 
les systemes formes par les purines et pyrimidines heterocycliques 
appariees. Ces agents hydrophobes s’intercalent facilement entre les 
plateaux formes par les bases au sein de la double helice. En se glissant 
entre les plateaux, ils les deforment et favorisent, lors de la replication, 
des insertions ou des deletions de nucleotides. 

Non reparees, toutes ces deteriorations interferent avec la replication 
ou la transcription et mettent en cause la survie cellulaire. II n’est done 
pas etonnant qu’au cours de 1’ evolution, des systemes d’identification 
et de reparation de ces dommages aient ete selectionnes. Ils sont bases 
sur des mecanismes d’ excision de la base ou du nucleotide defectueux, 
de reparation par recombinaison quand les deux brins de l’ADN sont 
en cause ou dans les cas extremes sur un mecanisme de « passage en 
force » au travers de la lesion. 

La reparation par excision d’une base incorrecte utilise une ADN 
glycosylase qui reconnatt et elimine la base indesirable en hydrolysant 
la liaison glycosidique unissant le pentose a la base. La reparation par 
excision d’un nucleotide est basee sur la reconnaissance de la distorsion 
de la double helice occasionnee par le nucleotide incorrect. Lorsque 
la deterioration concerne les deux brins lors d’une cassure complete 
de l’ADN, la reparation ne peut pas s’effectuer en utilisant Fun des 
brins comme matrice modele. Dans ce cas, un ADN homologue est 
utilise comme une matrice modele de secours, a la condition qu’il soit 
effectivement present dans la cellule. 

II arrive que l’ADN polymerase rencontre au cours de la replication 
une deterioration non reparee et soit bloquee dans son action de dupli- 
cation. Un mecanisme de forgage de la lesion peut alors se declencher. 
II est base sur Faction d’ ADN polymerases speciales, les ADN poly- 
merases de lafamille Y, qui synthetisent Y ADN directement en ignorant 
la lesion, sans le recours a Fappariement conforme a une matrice pour 
incorporer les nucleotides. La consequence inevitable de ce type de 
synthese est F introduction frequente de nucleotides incorrects. Cela 
assure toutefois la poursuite de la replication, essentielle pour la 
survie de la cellule, meme au prix d’un taux eleve de mutations. 

Contrairement aux idees predominates en vogue apres la decou- 
verte de sa structure, insistant sur le caractere invariant de l’ADN, on 
considere aujourd’hui la recombinaison et plus largement la mobilite 
et la plasticite de la sequence, comme des caracteristiques courantes et 
indispensables au fonctionnement et a la reproduction des etres vivants. 
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Figure 2.5 Mecanisme de la recombinaison homologue selon le modele de 
Holliday. Les lettres ABC et abc designent des regions homologues des ADN (alle- 
les) ou les sequences sont cependant legerement differentes.Les duplex hybrides 
resultant de la resolution de la jonction different selon le type de clivage. 
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Cette realite se manifeste particulierement a la mei'ose, notamment lors 
de l’echange de fragments entiers de chromosomes, par recombinaison 
homologue, dans un processus connu sous le terme de « crossing 
over » (voir chapitre 6). Elle est egalement illustree par les rearrange- 
ments et les deplacements de sequences connues sous le nom de 
transposition. 

La recombinaison homologue existe chez tous les organismes. Son 
mecanisme fondamental repose sur la rupture suivie de la reunion de 
deux molecules d’ADN homologues, c’est-a-dire identiques sur des 
regions d’au moins une centaine de bases, ce qui n’exclut pas la possi- 
bility de differences comme il en existe entre deux alleles d’un meme 
gene. Les deux molecules recombinantes sont porteuses de cassures 
symetriques sur l’un ou les deux brins et un appariement croise s’etablit 
entre les brins des deux molecules qui se connectent ainsi en une 
structure designee par le nom de son decouvreur, la jonction de 
Holliday (Fig. 2.5). Cette structure de jonction migre le long des deux 
molecules d’ADN par separation progressive des simples brins. Le 
processus est appele migration de branche. II assure une hybridation 
croisee des brins des deux origines. Finalement, des clivages inter- 
viennent. Ils liberent deux duplex d’ADN ayantechange des regions de 
taille variable selon les circonstances. Cette operation se nomme reso- 
lution de la jonction. Selon le type de clivage (Fig. 2.5), le reassorti- 
ment des regions entre les deux ADN concernes par la recombinaison 
fournit soit des duplex commutes et croises, soit des duplex simplement 
commutes. 
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2.2 LES DIFFERENTS TYPES DE MUTATIONS MODIFIANT 
OU NON LA FONCTION 

Les mutations geniques 

Ce sont tout d’abord les mutations ponctuelles, comme les insertions, 
les deletions et les substitutions qui appartiennent a la categorie des 
transitions et des transversions (voir Figure 2.2). Quand elles inter- 
viennent au sein d’une sequence genique codant une proteine, trois 
principales consequences peuvent en resulter : 

> La mutation seradite « silencieuse » si l’acide amine n’est pas modifie 
ce qui est souvent le cas si le changement de base concerne la 
3 e position du codon (voir a ce sujet, le code genetique dans le Mini 
Manuel de Biologie moleculaire) 

> La mutation sera dite « faux sens » si l’acide amine est different de 
celui normalement code. 

> La mutation sera dite « non sens » si un codon stop est forme, ce 
qui aboutit a une proteine tronquee. 
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> Les mutations « faux sens » par substitution de bases, ainsi que les 
mutations « non sens », respectueuses du cadre de lecture, a l’origine 
de maladies humaines, sont les plus frequentes (59 %). Les deletions 
representent 22 % et les insertions/duplications, 7 %. Les mutations 
modificatrices des sites d’epissage et celles presentes dans les regions 
regulatrices des genes, representent environ 1 1 % (Tableau 2.1 ). 

Tableau 2.1 Frequence relative des types de mutation 

RESPONSABLES DE MALADIES HUMAINES. 


Mutation 

Nombre 

% du total 

Deletion 

6 085 

21,8 

Insertion/duplication 

1 911 

6,8 

Rearrangement complexe 

512 

1,8 

Repetition 

38 

0,1 

Non sens/faux sens 

16441 

58,9 

Epissage 

2 727 

9,8 

Regulatrice 

213 

0,8 

Total 

27 027 

100 


L’effet d’une mutation ponctuelle est parfois annule par une deuxieme 
mutation qui restaure la base initialement presente (c’est une vraie 
reversion) ou qui intervient sur un deuxieme site grace auquel la fonc- 
tionnalite de la proteine sera restauree. C’est le cas d’une deletion qui 
interrompt le cadre de lecture qu’une insertion tres proche restaurera. 
C’est le cas aussi des ARN de transfert suppresseurs de mutations ou 
F anticodon est porteur d’une mutation qui permet de lire un codon 
sens prealablement mute en codon stop. 

Les insertions peuvent comporter plusieurs bases ou nucleotides. 
Les elements transposables (transposons) ou les repetitions de bases 
(comme AC ou TG) presentes dans les rnicrosatellites et incorrectement 
repliquees sont de bons exemples de ce type d’evenement. Lorsqu’ils 
se produisent a l’interieur d’une sequence genique les effets portent 
sur la sequence codante ou bien les sites d’epissage ce qui dans les 
deux cas, altere finalement la proteine. Le transposon peut cependant 
a son tour etre excise, ce qui restaure la sequence initiale. Dans le cas 
d’une deletion, la sequence codante d’un gene sera irreversiblement 
alteree ( Fig. 2.6). 
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7q31 .2 — CFTR 


La phenylalanine 508 est mutee 
chez la majorite des patients 
atteints de mucoviscidose 


7q36.3 

Chromosome 7 


Figure 2.6 Deletion de trois bases dans la sequence ADN du chromosome 7 
humain (gene CFTR pour Cystic FibrosisT ransmembrane Conductance Regulator). 

Cette deletion, tres frequente chez les patients atteints de mucoviscidose, elimine une 
phenylalanine de la sequence polypeptidique avec comme resultat d'inactiver la proteine 
qui controle le passage des ions chlore a travers la membrane des tissus secreteurs ce qui 
bloque leur fonctionnement normal par un encombrement du aux mucosites et autres 
secretions qui ne sont pas evacuees. 


Les mutations chromosomiques : 
amplifications, deletions, translocations, 
inversions, perte d'heterozygotie 

Les mutations peuvent interesser des regions entieres de chromosomes. 
Ce sont des evenements qui se produisent au moment de la division 
cellulaire lorsque des recombinaisons ont lieu, particulierement au 
moment de la meiose donnant naissance aux gametes. Ces derniers 
transmettront a la descendance la mutation chromosomique dont ils 
sont porteurs. Comme pour les mutations ponctuelles, les mutations 
chromosomiques se presentent sous la forme de duplications (ou ampli- 
fications) et de deletions de regions entieres qui amenent souvent la 
fusion de genes a l’origine separes. Dans ce dernier cas, il peut s’agir de 
translocations ou d’inversions de fragments entre deux chromosomes. 
L’evenement se trouve souvent a l’origine de fusions geniques dont 
les produits sont des proteines de fusion, parfois responsables de 
processus de tumorisation et de cancers (Fig. 2.7). C’est le cas par 
exemple de la deletion chromosomique conduisant a la fusion des genes 
FIG et ROS et a la production d’une proteine de fusion possedant une 
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■ Deletion 


■ Duplication 


■ Inversion 



Chr.9 

■ Insertion 



Chr.9 




W W 


Chr. 9 Chr. 9 



W 

Chr. 1 


■ Translocation 




Figure 2.7 Les cinq principaux types de mutations chromosomiques. 
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activite permanente de tyrosine kinase, ce qui a pour effet la transfor- 
mation tumorale des cellules gliales et de provoquer un cancer du 
cerveau. 

Dans un organisme qui presente deux alleles differents pour un 
meme gene (etat heterozygote), la deletion ou un evenement de 
recombinaison specifique peuvent conduire a la perte de Tun des deux 
alleles et a la perte de l’heterozygotie. 

Les mutations pertes ou gains de fonction 

Les effets phenoty piques consecutifs a une mutation sont parfois 
utilises pour qualifier la mutation elle-meme. C’est ainsi qu’on parle 
de mutations « perte de fonction » ou « gain de fonction ». Lorsque 
la perte de fonction est consecutive a 1’ inactivation ou la disparition 
de l’un des deux alleles d’un gene, on parle d’allele nul et la mutation 
est dite amorphique (sans phenotype). Tres souvent de telles mutations 
sont recessives, sauf lorsque qu’elles concernent des organismes 
haploides (presence d’un seul genome) ou que le phenotype, pour etre 
exprime, necessite 1’ activite des deux alleles du gene d’un organisme 
diploi'de. Dans ce cas, on parle d’haploinsuffisance pour signaler une 
expression incomplete du phenotype, due a la perte d’ activite de l’un 
des deux alleles. 

Les mutations dites « gain de fonction » modifient le produit du gene. 
L’ ARN ou la proteine acquiere une fonction nouvelle qui change gene- 
ralement le phenotype observe chez 1’ organisme considere (mutation 
neomorphique). Ces mutations sont generalement dominantes. 

II existe un type de mutation dite « dominante negative » dont 
Faction se manifeste par une alteration de l’effet de l’allele de type 
sauvage responsable du phenotype habituel. Le produit altere (ARN 
ou proteine) de l’allele mute, interagit negativement avec le produit de 
F allele sauvage qui ne peut alors exprimer pleinement son effet pheno- 
typique. Un bon exemple en est donne par le syndrome de Marfan, 
une maladie genetique humaine due a une mutation du chromosome 
1 5 touchant le gene FBN1 qui code la fibrilline 1 , une glycoproteine 
essentielle pour la formation des fibres elastiques des tissus constitutifs 
des ligaments associes a la formation du squelette et a son equilibre, 
mais aussi constitutifs de l’aorte et de 1’ ceil. En se liant au facteur de 
croissanceTGFp, la fibrilline controle son niveau d’ activite. La mutation 
du gene FBN1 reduit le niveau de la fibrilline et un exces de TGF(3 en 
resulte qui est a l’origine du syndrome. 

Les mutations dites letales conduisent a la mort de 1’ organisme 
porteur. Lorsqu’elles se manifestent au stade embryonnaire precoce, 
l’embryon meurt et les mutations restent souvent de ce fait, ignorees. 
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Autres types de mutations : 

phenotypiques, biochimiques et conditionnelles 

Parce qu’elles affectent l’aspect de l’organisme porteur certaines 
mutations sont dites « morphologiques ». Elies se manifestent par des 
modifications de la taille ou de T aspect d’un organe. De telles muta- 
tions ne sont pas necessairement associees a des changements de la 
sequence genomique. Elies resultent souvent d’ alterations epigeneti- 
ques dont l’origine se trouve dans Taction de facteurs environnemen- 
taux. Parfois cependant un mutant morphologique resulte directement 
d’une mutation dans Tun des composants d’une voie enzymatique. On 
parle alors de mutation « biochimique » (voir chapitre 5, p. 137). Dans 
d’ autres circonstances, ce sont les conditions environnementales qui 
imposent le phenotype correspondant. Ainsi, pour un mutant dit 
« conditionnel » (voir chapitre 4) une mutation sensible a la tempera- 
ture provoquera la mort cellulaire si la temperature s’avere trop elevee 
(conditions restrictives) alors qu’a plus basse temperature (conditions 
permissives) la cellule survivra. 

Nomenclature 

II existe une nomenclature simple pour designer les mutations ponc- 
tuelles qui sont des substitutions ou des deletions. On ecrira par exemple 
Q2 1 3H pour nommer la substitution de la glutamine en position 2 1 3 par 
T histidine. Q designe la glutamine dans le code international a une lettre, 
213 designe la position de la glutamine a partir de Textremite N de la 
proteine et la lettre H, Thistidine qui est substitute a la glutamine. 

Dans le cas d’une deletion, on ecrit AQ213. Le signe grec A (delta) 
indique la deletion. La lettre Q designe la glutamine presente dans la 
sequence de type sauvage et le nombre designe la position ou se trouve 
la glutamine a partir de Textremite N de la proteine. 

On procede de fagon similaire pour designer les mutations affectant 
les bases puriques et pyrimidiques de l’ADN et de TARN. 

2.3 LA NOTION DE PARAMUTATION 

Cette notion fait reference a Texistence d’une interaction entre les deux 
alleles d’un locus. En effet, dans la paramutation, un des deux alleles 
presents a une generation affecte de fagon heritable T autre allele dans 
les generations ulterieures, meme si T allele responsable du changement 
n’est pas lui-meme transmis. La paramutation constitue done une 
exception a la regie mendelienne de la segregation independante des 
alleles. Quel est le support physique qui est responsable de la transmis- 
sion de T information genetique dans un tel phenomene ? La reponse 
designe aujourd’hui de petits ARN, sous toutes les formes non codantes 
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Figure 2.8 Paramutation du gene Kit chez la souris. 

A la generation FI, bien que les souris males aient un 
genotype de type sauvage +/+, le phenotype de leur 
queue correspond a un genotype mute /(/f ,m M,f /+.Croises 
avec des femelles de type sauvage +/+, les individus F2 
continuent de presenter, quoique souvent a un moindre 
degre, le phenotype mutant. L'extremite de la queue de 
souris males possedant un allele paramutagenique Kit tm,Alf 
et un allele de type sauvage (+) est blanche au lieu d'etre 
coloree. L'allele Kit tm,Alf produit un ARNm incorrect qui 
est embarque dans le sperme et transmis a I'embryon 
apres fecondation de I'oeuf. Meme si les descendants 
possedent les deux alleles sauvages, ils expriment cepen- 
dant un phenotype dit « extremite de la queue blanche ». 
Ce phenotype est du a Taction de I' ARNm Kit tmlAlf qui 
provoque soit une degradation ciblee interferentielle de 
I'ARNm sauvage, soit un blocage de sa traduction. La 
disparition progressive au cours des generations succes- 
ses de I'ARNm Kit tm,Alf incorrect ou de ses produits 
inhibiteurs derives conduit progressivement a une perte 
de la paramutation. 




F2 
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connues. Ces ARN sont transmis par les cellules sexuelles (gametes) de 
generation en generation. L’ ARN doit done etre considere a part entiere 
comme une molecule de l’heredite (voir aussi fin du chapitre 7). 

Des exemples sont connus chez les vegetaux. L’allele paramuta- 
genique R st au locus R peut influencer F allele dominant paramutable R R . 
R st peut meme, au long des generations, controler un large eventail de 
phenotypes de coloration chez le mai's, depuis F absence de couleur 
des grains jusqu’a la plus intense des colorations. Un tel phenomene 
est egalement rencontre chez les mammiferes (Fig. 2.8). 

2.4 EFFETS DES MUTATIONS 
Effets def avorables 

La plupart des mutations, notamment celles qui sont ponctuelles ou 
celles qui ne concernent qu’une region tres limitee du genome n’ont 
pas d’effet phenotypique. Elies sont dites neutres. Les effets indesirables 
se manifestent par contre des qu’une mutation de F ADN, non corrigee 
par le systeme de reparation, modifie : 

> la sequence d’une proteine au point d’alterer sa fonction moleculaire, 

> la quantite du produit du gene ou de la region mutee, qu’elle code 
une proteine, meme si la fonction de celle-ci n’est pas alteree, ou 
un ARN qu’il soit lui-meme codant ou non codant 

> la localisation subcellulaire du produit du gene (ARN ou proteine). 

Le resultat aboutit a une alteration du fonctionnement de la cellule 
porteuse de la mutation et du desordre genetique, generateur d’un 
effet phenotypique sou vent defavorable se transmettra a la descen- 
dance si la cellule en question appartient a la lignee germinale (lignee 
formatrice des gametes) de Findividu. 

Effets favorables 

II arrive cependant que certaines mutations aient des effets positifs et 
conferent aux organismes qui en sont porteurs des proprietes qui 
ameliorent leur adaptation aux changements environnementaux. Deux 
exemples concernant Fespece humaine sont particulierement demons- 
tratifs de ce phenomene. L’un des cas concerne les personnes porteuses 
d’une mutation ponctuelle de la globine (un acide glutamique est 
substitue par la valine) responsable de l’anemie falciforme (Fagregation 
de l’hemoglobine deforme les hematies qui adoptent une forme en 
faucille et circulent mal) mais qui sont par contre en raison de cette muta- 
tion resistante a la malaria (paludisme), F agent infectieux (Plasmodium) 
etant mal transports. 

L’allele responsable est un allele autosomal (chromosome 11) recessif. 
A l’etat heterozygote, les porteurs de la mutation ne presentent que 
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quelques hematies deformees et ne sont pas anemies, mais cela suffit 
pour leur conferer la resistance a la malaria. C’est un cas ou l’hetero- 
zygotie d’un allele confere au porteur un avantage sur les deux genotypes 
homozygotes. 

L’ autre cas conceme une deletion de 32 bases dans le gene codant 
un recepteur de cytokines nomme CCR5 qui est exprime preferentiel- 
lement dans les lymphocytes T, les macrophages et les cellules 
dendritiques. Ce recepteur est utilise par le VIH (virus du sida) comme 
corecepteur pour coloniser les lymphocytes T. Sous sa forme mutee 
(CCR5-A32) il est non fonctionnel et confere aux porteurs homo- 
zygotes une resistance a 1’ infection par le VIH ; pour les heterozygotes, 
il retarde le processus infectieux. Cette mutation, plutot rare, n’affecte 
pas la sante des porteurs qui sont plus frequents dans les populations 
europeennes ou sa presence serait liee a une selection naturelle inter- 
venue vers le milieu du xiv e siecle vis-a-vis de la peste bubonique 
qui sevissait alors en Europe. En effet, 1’ agent bacterien de la peste 
( Yersinia pest is) utilise egalement CCR5 pour coloniser les cellules 
du systeme immunitaire. 

2.5 LA NOTION DE SELECTION 

La selection est un processus biologique complexe a la base de 
1’evolution des especes. Il se deroule dans la nature (selection natu- 
relle) mais peut aussi etre dirige a son profit par l’homme (selection 
artificielle). 

La selection naturelle 

La selection, sous sa forme naturelle theorisee en 1859 par Charles 
Darwin, aboutit a ce que les caracteristiques (traits phenotypiques) favo- 
rables, transmises entre individus capables de se reproduire deviendront 
de plus en plus frequentes chez les descendants au cours des genera- 
tions successives. Si les caracteristiques ainsi selectionnees ont une 
base genetique, au sens des decouvertes faites a la meme epoque par 
Gregor Mendel, le genotype correspondant deviendra egalement de 
plus en plus frequent dans les generations suivantes. De fagon syme- 
triquement inverse, la frequence des caracteristiques defavorables et 
celle de leurs genotypes correspondants diminueront progressivement. 

La selection naturelle peut se manifester a divers stades du cycle 
vital d’un organisme ayant une reproduction sexuee (Fig. 2.9). 

Il arrive que la selection naturelle de leurs caracteristiques pheno- 
typiques assure aux individus porteurs une excellente adaptation au 
milieu dans lequel ils vivent (niche ecologique). Le maintien d’une 
telle selection basee sur un processus interactif entre genotype et 
milieu peut aboutir finalement a 1’ emergence d’une nouvelle espece. 
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Reproducteurs 



Figure 2.9 Identification des divers stades du cycle vital d'un organisme ou 
s'exerce avec des effets majeurs la selection naturelle. 

Capacite a se reproduire (ne pas disparaitre avant d'etre capable de se reproduire), 
Competition sexuelle (competition entre adultes pour se reproduire), Nombre de 
descendants (et duree de la periode d'aptitude a la reproduction), Fecondite croisee 
(fecondite relative male et femelle), Viabilite et selection des gametes (suivant les 
evenements de recombinaison meiotique), Compatibilite des gametes (plus ou moins 
grande compatibilite sperme-ovule). 


Cette idee simple repose sur le concept d’adaptation et demeure 
aujourd’hui encore a la base de la theorie de revolution des especes 
vivantes, meme si celle-ci s’enrichit depuis les annees 1950, de 
nombreuses connaissances cellulaires et moleculaires. 

On retrouve le concept d’adaptation (et d’ adaptability) dans la 
celebre expression decrivant la selection naturelle comme « la survie 
du plus apte », expression que l’on remplace volontiers aujourd’hui 
par « le plus apte est celui qui peut le mieux se reproduire ». En effet, 
si un individu vit deux fois moins longtemps que les autres de la meme 
espece, mais qu’il engendre deux fois plus de descendants capables 
eux-memes de se reproduire, ses genes seront bien mieux representes 
dans les generations suivantes que ceux de ses congeneres. 

Le concept d’adaptation d’un organisme depend done en premiere 
approximation de F adaptability des alleles (genes) qui Font fa^onne. 
Mais, F adaptability d’un individu particulier se refere habituellement 
a un trait ou un ensemble de traits phenoty piques. II est alors preferable 
de relier plus simplement F adaptability de l’individu a F adaptability de 
son genotype. On ne doit pas oublier cependant que F adaptability 
exprime la valeur selective moyenne d’une population et non la valeur 
selective d’un individu de cette population. C’est ainsi, en appui de 
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cette observation, qu’un allele porteur d’une mutation favorable, apparue 
chez un individu qui cependant disparait accidentellement avant de 
pouvoir se reproduire, aura une adaptability selective nulle, bien que 
le trait phenoty pique resultant ait pu etre benefique pour Forganisme 
en question. 

Finalement, la selection naturelle peut aboutir a ce que la frequence 
d’un allele augmente parce que son adaptability sera plus grande que 
celle des autres alleles. II peut arriver meme que 1’ allele soit fixe, 
c’est-a-dire que sa frequence soit de 1 (aucun autre allele n’est present 
dans la population). II peut arriver a l’inverse que la selection main- 
tienne a un faible niveau un allele ayant un effet defavorable sur le 
phenotype, le processus pouvant aller parfois jusqu’a 1’ elimination de 
ce dernier (frequence 0). La situation la plus courante cependant est 
celle du maintien d’un allele avec une frequence intermediate dans la 
population. C’est souvent le cas des organismes diploi'des ou les indi- 
vidus heterozygotes porteurs de deux alleles differents (un sur chaque 
chromosome homologue) possedent une meilleure adaptability que 
les individus homozygotes porteurs de deux alleles identiques. L’un 
des exemples les mieux connus de ce processus est celui des porteurs 
de 1’ allele du gene de la globine conferant une resistance a la malaria. 
Cet allele, a Fetat homozygote, est responsable de l’anemie falci- 
forme qui peut etre fatale (voir plus haut). De fagon etonnante, 
l’heterozygotie confere une survie et une capacite a se reproduire 
superieure aux deux formes d’homozygotie. D’ autres exemples de 
selection de l’heterozygotie sont connus, les plus inattendus etant ceux 
qui semblent responsables ou associes a la selection avantageant la 
parentele et les comportements d’altruisme reciproque. 

Dans sa version la plus etonnante, l’altruisme consiste pour un orga- 
nisme (unicellulaire ou multicellulaire) a se « sacrifier » afin d’apporter 
a ceux qui lui sont les plus proches genetiquement, sa fratrie en quelque 
sorte, un secours essentiel a leur survie, avec comme consequence, a 
defaut de promouvoir la diffusion de ses propres genes, de favoriser la 
diffusion de genes apparentes. De nombreux exemples ont ete identifies 
et interpretes avec cette grille de lecture. Ils vont des bacteries et 
protistes jusqu’aux mammiferes et a l’homme. Lorsque les conditions 
environnementales deviennent defavorables (manque de nourriture) 
les myxobacteries et les myxomycetes qui vivent normalement a Fetat 
unicellulaire, s’agregent, forment des colonies ou certaines cellules 
meurent afin d’assurer la survie des autres. Ce type de comportement 
assimilable a un comportement social se retrouve chez le nematode 
C. elegans ou une mutation ponctuelle dans un neuropeptide deter- 
mine le comportement alimentaire, individuel ou de groupe. II est 
rencontre aussi chez les mammiferes ou certains individus n’hesitent 
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pas a se designer aux predateurs par un signal d’alerte, favorisant 
ainsi la fuite des autres individus qui lui sont apparentes. Certains 
auteurs tirent de ces observations des arguments en faveur de l’idee 
que les mecanismes assurant la survie et la propagation des genes sont 
particulierement efficaces du point de vue de Involution. Certains 
autres auteurs vont jusqu’a considerer que les comportements soli- 
daires et charitables de certains individus de l’espece humaine ne 
repose pas sur des facultes morales superieures, fruits du progres de la 
civilisation et correctrices d’une sorte egoi'sme genetique, mais plutot 
sur des circuits neuronaux primitifs, habituellement actives dans les 
relations de satisf action et de plaisir procurees par la nourriture, 1’ acti- 
vity sexuelle ou la relation sociale (voir aussi fin du chapitre 7). 

La selection artificielle 

C’est la selection pratiquee par les cultivateurs, les eleveurs et les 
societes ou organismes producteurs de semences vegetates et animales. 
Elle repose sur le fait que la plupart des traits phenotypiques des 
especes vivantes exploitees par l’homme dependent, lorsqu’ils ont une 
base hereditaire, de l’interaction de nombreux genes. Les variations 
de ces traits, lorsqu’elles sont dues a un seul gene, ne produisent done 
a chaque etape de selection qu’un effet quantitatif tres faible sur les 
phenotypes. Dans une espece, une race animale ou une variete vegetate, 
les phenotypes d’interet se presentent ainsi sous la forme de series 
continues au sein desquelles les selectionneurs cherchent par des accou- 
plements diriges, a stabiliser ou a eliminer, les traits qu’ils jugent 
favorables ou defavorables. Ils operent generalement en procedant a 
une selection par troncature (Fig. 2.10 et 2.1 1). Tous les individus 
ayant une valeur pour le trait d’interet superieure a une valeur seuil, 
sont selectionnes et utilises comme reproducteurs. La valeur S ou ecart 
selectif est definie comme F ecart impose entre la valeur moyenne du 
caractere pour la sous-population des reproducteurs selectionnes a la 
generation d’origine et la valeur determinee pour Fensemble de la 
population parentale (generation 1). La reponse R a la selection ou 
progres genetique represente la difference entre les moyennes etablies 
pour deux generations successives. Elle montre que la superiorite 
genetique des individus selectionnes a ete transmise a leurs descen- 
dants. Le rapport R/S (reponse de selection sur ecart selectif) mesure 
F augmentation de la valeur additive, e’est-a-dire l’heritabilite du 
caractere considere. 

Tant qu’une variability genetique existe entre les individus d’une 
population soumise a la selection artificielle, un progres genetique 
peut etre enregistre. A partir d’un certain nombre de generations, la 
variance genotypique additive du caractere comme son heritabilite 
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Mesure 
du caractere 

Figure 2.10 Principe de la selection par troncature apres etablissement de la 
courbe de distribution du caractere que le selectionneur veut ameliorer. 

La generation 2 resulte d'un croisement entre reproducteurs, selectionnes a la genera- 
tion 1. On observe un progres genetique R, en reponse a la selection. S mesure I'ecart 
selectif. En conservant le meme point de troncature au cours des generations successives, 
on enregistre a la generation x, un deplacement tres significant de la courbe de distri- 
bution, vers la droite.Cela signifie que le progres genetique, pour le caractere concerne, 
est devenu pour la majorite de la population, superieur au point de troncature, fixe en 
debut de selection. 
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seront nulles. Tous les individus selectionnes au fil des generations 
auront theoriquement le meme genotype, du a la fixation des alleles 
responsables de raccroissement de la performance pour le caractere 
choisi. 



Figure 2.1 1 Reponse des animaux soumis a une selection artificielle par troncature. 

Les reproducteurs sont selectionnes par troncature aux deux extremites de la courbe 
de distribution du caractere (voir figure 2.10). Au fil des generations, cette selection 
produit des populations qui divergent fortement pour le caractere concerne (id le 
poids de graisse ramene a la carcasse). L'application systematique d'une telle selection 
au fil des generations produit des populations A et B qui divergent fortement pour le 
caractere considers 


Relations entre selection et variation genetique 

II doit etre note qu’une partie importante de la variability genetique 
(la difference de genotypes) observee entre les individus s’avere sans 
effet sur les phenotypes et n’influence pas non plus l’adaptabilite des 
individus. On dit de cette variabilite associee a la diversity qu’elle est en 
verite neutre du point de vue de 1’ evolution selon la theorie proposee 
par Motoo Kimura. Autrement dit il n’y a pas de relation directe entre 
la variation genetique et des differences dans 1’ adaptability des indi- 
vidus constitutifs d’une population. Les mutations qui interviennent 
dans le genome sans modifier son expression seraient sans effet sur 
cette adaptability. On a pense pendant longtemps que les mutations 
neutres concemaient principalement l’enorme fraction des genomes qui 
n’est pas occupee par les sequences codantes des genes a l’origine des 
proteines. Que des mutations interviennent dans ces regions n’avaient 
pas d’ importance puisque les proteines a l’origine des phenotypes 
n’etaient pas concernees. Cette conception fait place maintenant a une 
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vision tres sensiblement differente depuis que Ton sait que les regions 
non codantes de l’ADN sont majoritairement transcrites et que les 
ARN non codants influencent fortement l’expression des genes et done 
les phenotypes (voir chapitre 5, ENCODE). II est a prevoir que de 
nouvelles theories a propos de la selection naturelle et de ses rapports 
avec 1’evolution, integrant les donnees concemant la nature des genes et 
leur expression verront le jour dans les prochaines annees. La concep- 
tion que Ton se fait de la balance entre mutations et selection peut s’en 
trouver modifiee. La selection est en effet un processus qui en eliminant 
les mutations defavorables a une adaptation environnementale reduit la 
variabilite genetique apportee par les mutations. Dans le meme temps, 
de nouvelles mutations, aleatoires, se produisent qui realimentent la 
variabilite genetique au sein d’une population. Une balance, un equi- 
libre s’etablit entre les deux processus (vitesse d’ apparition des muta- 
tions et elimination des mutations defavorables). De cette balance 
resulte en quelque sorte la force propulsive de 1’ evolution. 

2.6 LA DISTINCTION ENTRE PHENOTYPE ET GENOTYPE 

Le phenotype d’un etre vivant correspond a son apparence physique 
d’ ensemble ou bien a un aspect particulier (on dit aussi une caracteris- 
tique, un trait) mesurable de cette apparence generate, comme sa 
taille, son poids, sa couleur, une forme, une propriete, une aptitude ou 
un comportement qui varient suivant les individus examines. Pour une 
large part, le phenotype depend du genotype, autrement dit des genes 
et surtout de leurs alleles presents dans les chromosomes de l’individu. 
La plupart des phenotypes sont determines par de nombreux genes et 
sont influences par les facteurs physico-chimiques et biologiques de 
l’environnement dans lequel vit l’individu ou la population a laquelle 
il appartient. 

La description du phenotype d’un individu s’avere en general plus 
facile a realiser - par de simples mesures structurales, biochimiques, 
physiologiques ou comportementales - que celle de son genotype qui 
necessite d’acceder a la sequence de 1’ ADN. On ne sait en effet etablir 
cette sequence que depuis quelques dizaines d’ annees seulement. 
Auparavant les geneticiens deduisaient la fonction des genes a partir 
du seul examen des phenotypes. La genetique classique ou genetique 
directe part done des phenotypes pour alter vers les genotypes, a 
l’aide souvent de mesures et d’ analyses quantitatives portant sur les 
phenotypes (genetique quantitative). Avec les progres de la biologie 
moleculaire, une genetique inverse se developpe qui part des geno- 
types et parfois des genomes entiers, pour connaitre les phenotypes. 
Adeptes de la premiere genetique, cultivateurs et eleveurs, integrent 
aujourd’hui les demarches de la genetique moleculaire dont la 
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puissance predictive des phenotypes s’accroit avec les progres 
realises dans la connaissance approfondie des genomes entiers 
(sequengage et genotypage, voir chapitre 5, GWAS). 

Les differences constatees entre les phenotypes individuels sont 
revelatrices de la variability genetique existant entre les individus. On 
l’a vu, la selection naturelle agit sur les phenotypes en favorisant ou 
non les individus dont les phenotypes assurent la plus ou moins bonne 
adaptabilite a l’environnement. Sans differences phenotypiques, il ne 
pourrait y avoir de differences dans 1’ adaptabilite et par voie de 
consequence pas de selection naturelle et pas d’ evolution. 

Le jeu complexe qui s’etablit entre phenotype, genotype et milieu 
est parfois represente par la relation : 

genotype + environnement phenotype 

ou, mieux encore afin de tenir compte des variations aleatoires, par la 
relation : 

genotype + environnement + variation aleatoire — » phenotype 

Ces relations expriment d’une maniere simpliste les interactions 
qui s’etablissent entre les genes et l’environnement. Elies expriment 
egalement les termes du debat classique et tou jours d’actualite entre 
ce qui appartient a l’inne (heritable par les genes) et ce qui appartient 
a F acquis (apporte ou non par l’environnement). Dans Fexemple de 
la phenylcetonurie (voir chapitre 7, p. 8) un regime alimentaire 
approprie, depourvu de phenylalanine suffit a eviter que la maladie 
genetique se manifeste. II s’agit la d’un exemple classique des rela- 
tions entre gene (mute) et environnement (alimentation). II existe 
aussi des circonstances ou des organismes porteurs d’un genotype 
particulier agissent de telle maniere qu’ils modifient ou choisissent 
leur propre environnement. Dans ce cas, il s’agit d’un processus 
inverse de celui, illustre par Fexemple de la phenylcetonurie. L’envi- 
ronnement est cree par le genotype. De tres nombreux exemples sont 
donnes par les comportements de diverses especes comme, par 
exemple ceux des populations humaines dans la mise en oeuvre de 
leurs habitats. 

2.7 LIAISON GENETIQUE ET DESEQUILIBRE DE LIAISON 
Liaison genetique et selection 

Contrairement aux observations de G. Mendel, certains genes ne 
segregent pas a la meiose de fagon independante. Quand les locus de 
deux genes sont lies ou tres proches Fun de l’autre sur le meme chro- 
mosome, on dit qu’ existe une liaison genetique. Au cours de la forma- 
tion des gametes, un brassage du materiel genetique s’opere grace a 
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des croisements par recombinaison (« crossing over »). Plus les genes 
sont proches les uns des autres sur un chromosome, plus faible est la 
probability qu’un evenement de recombiaison entre chromosomes 
vienne a les separer. II en resulte que si l’un des genes est l’objet 
d’une selection (naturelle ou artificielle), les autres genes qui lui sont 
proches ont toutes les chances d’etre eux aussi selectionnes. Au final, 
la selection agit sur le potentiel de variation du genome et suivant les 
circonstances et l’echelle de temps consideree, elle peut ou non 
appauvrir la variability intrinseque du genome, objet de la selection. 

Par une selection systematiquement dirigee, il peut arriver qu’un 
gene (un allele de ce gene), responsable d’un phenotype recherche par 
l’eleveur ou le cultivateur, voit augmenter sa frequence au sein de la 
population. Les alleles d’ autres genes qui lui sont lies au locus chromo- 
somique qu’ils occupent, verront du meme coup egalement leur 
frequence augmenter, quelle que soit leur action effective (neutre, 
positive ou negative). Poussee a l’extreme, une telle selection 
conduira a fixer dans la population et pour la region genomique 
consideree, un seul haplotype, c’est-a-dire une seule combinaison 
allelique (1’ allele du gene cible de la selection et les alleles des genes 
lies voisins). 

Liaison genetique entre deux caracteres presents 
dans un famille humaine 

II s’agit ici de la liaison genetique entre deux caracteres phenotypiques 
exprimes ou portes par le chromosome X humain (Fig. 2.12). Le 
premier caractere est un retard mental (represente sur la figure par un 
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(J) [J] chromosome X « fragile » 

Figure 2.12 Genealogie d'une famille humaine oil s'observe chez les gar^ons 
une liaison genetique entre un retard mental et la presence d'un site fragile sur le 
chromosome X. 

Le symbole en losange barre correspond a la detection du site fragile lorsd'un diagnostic 
prenatal. 




Copyright © 2015 Dunod. 


50 


Chapitre 2* Mutations et selection 


symbole male ou femelle a moitie noir, voir Fig. 1.7 pour la signification 
des symboles). Le second caractere se rapporte a un aspect particulier 
du chromosome X qui peut presenter un site dit « fragile », une 
amorce de cassure souvent visible, chez les individus porteurs, dans 
les cellules en metaphase (represente ici par le grise de la partie droite 
des symboles). 

Le retard mental est recessif et n’est done pas detecte chez les meres 
« transmetteuses ». En effet bien qu’elles soient porteuses d’un chromo- 
some X avec un site fragile, et que celui-ci soit detecte sans ambigui'te, 
elles ne presentent pas de retard mental puisque leur deuxieme chromo- 
some X est normal. En examinant les gargons de la famille, on constate 
que les deux caracteres (retard mental et site fragile du chromosome X) 
sont totalement correles. Cela signifie que les determinants genetiques 
de ces deux caracteres sont tres proches sur le meme chromosome (en 
l’occurrence ici le chromosome X). Le chromosome Y des gargons, 
d’une taille reduite et avec peu de genes (voir chapitre 3), ne comporte 
pas les determinants genetiques (les alleles) du chromosome X. II ne 
compense done pas F absence du deuxieme chromosome X. 

Le desequilibre de liaison mesure une distribution 
non aleatoire de marqueurs genetiques 

Le desequilibre de liaison decrit la situation qui dans une population 
resulte de certaines combinaisons d’ alleles ou de marqueurs genetiques 
dont la frequence differe de celle qu’on attend d’une formation aleatoire 
d’haplotypes. Autrement dit, les associations non aleatoires entre genes 
(alleles) a differents loci sont mesurees par le degre de desequilibre de 
liaison. 

L’etude des liaisons entre genes conduit souvent a designer une 
region chromosomique de quelques megabases comme porteuse d’un 
locus associe a un trait phenotypique d’interet (designe parfois par le 
terme QTL, pour Quantitative Trait Loci). II s’agit souvent chez 
l’homme du locus ou se trouvent les determinants d’une maladie 
genetique ; chez F animal ou la plante, d’un locus associe a un caractere 
phenotypique interessant le selectionneur. Puisque plusieurs centaines 
de genes sont susceptibles d’etre localises dans cette region chromo- 
somique, analyser chacun d’eux s’apparente a une mission impossible. 
L’ alternative peut consister non pas a etablir l’existence d’une liaison 
genetique entre un marqueur polymorphe et la maladie ou le QTL, par 
F etude de quelques generations d’ individus au sein d’un petit nombre 
de families, mais au contraire a montrer la coexistence d’un polymor- 
phisme de marqueurs avec le QTL ou la maladie. On realise pour cela 
des etudes dissociation au sein d’une population entre des marqueurs 
polymorphes et le gene fonctionnel (ou le determinant genetique) 
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responsable du caractere phenotypique analyse (maladie ou trait quan- 
titatif interessant). Le raisonnement est base sur le fait qu’en raison de 
la grande proximite physique entre le marqueur et le gene (ou le deter- 
minant genetique) un grand nombre de generations sont necessaires 
pour qu’ils soient separes par recombinaison. On s’ attend done a ce 
que les individus porteurs du caractere analyse presentent le meme 
haplotype de marqueurs avec une frequence plus elevee que celle qui 
est attendue d’une distribution aleatoire, meme si les individus sont 
apparentes. Aujourd’hui les marqueurs polymorphes les plus informatifs 


Mutation ponctuelle 

Nucleotide variant responsable 
d'une maladie ou d'un QTL 

I 

ADN l l l l l l ■ ■ ll Haplotype ancestral 

AT A X G C T G 


Multiples recombinaisons 

V 


ADN I II I I I I I a ll Haplotype actuel 1 

[G] T A X G C T G 


ADN I I I I I I I I II Haplotype actuel 2 

AT A X G C T [A] 


ADN I I I I I I 1 I II Haplotype actuel 3 

AT A X G C [A] [A] 


ADN I l l » » l l l ll Haplotype actuel 4 

AXG C T G 

Figure 2.13 Illustration simplifiee de la distribution non aleatoire de marqueurs 
SNP dans une region chromosomique ou doit se trouver une mutation responsable 
d'un trait phenotypique caracteristique de tous les individus analyses. 

On suppose dans I'exemple que cette mutation est responsable d'un trait quantitatif 
(QTL) chez I'animal ou la plante ou d'une maladie chez I'homme et qu'elle s'est produite 
anterieurement dans une region caracterisee par I'haplotype ATAGCTG. Elle est designee 
ici par la lettre X. Au cours des generations successives cet haplotype a subi des recom- 
binaisons. Ainsi, a titre d'exemple, la formation de I'haplotype 1 actuel resulte d'un 
evenement de recombinaison qui s'est produit entre les 1 er et 2 nd SNP. Les nouveaux 
alleles qui se sont ainsi progressivement formes au fil des generations sont identifies 
dans un carre de couleur rose. La plus petite signature haplotypique conservee (AGC) 
entre tous les individus porteurs du phenotype d'interet, e'est-a-dire en desequilibre 
de liaison, montre que la mutation responsable du QTLou de la maladie pourrait bien se 
situer entre les SNP 3 et 4 qui sont les plus proches I'un de I'autre et les moins suscep- 
tibles d'etre recombinants. Cette demarche de cartographie des haplotypes SNP permet 
ainsi d'identifier une region candidate de taille limitee contenant la mutation d'interet 
dont I'identification definitive sera rendue accessible par exemple par des resequences 
en serie. 
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dans la recherche des regions genomiques associees a des traits pheno- 
typiques d’interet sont les SNP (Single Nucleotide Polymorphism) 
c’est-a-dire les nucleotides dont la nature de la base purique ou pyri- 
midique (A, T, G, C) varie (est polymorphe) selon les individus 
examines (Fig. 2.13). La coexistence chez un meme individu de deux 
genomes parentaux conduit au fait qu’un SNP peut se presenter sous un 
etat heterozygote (les deux bases des deux genomes sont differentes) ou 
sous l’un des deux etats homozygotes (les deux bases sont identiques, 
chaque paire correspondant a l’une ou 1’ autre des bases de l’etat hetero- 
zygote correspondant). 

L’exemple de la figure 2.13 montre que le desequilibre de liaison 
est du a plusieurs facteurs parmi lesquels on peut citer : 

► la distance genetique entre loci ; 

► la distance chronologique, c’est-a-dire l’anciennete de la mutation 

qui a genere le polymorphisme. 

Le desequilibre de liaison peut s’ exprimer par la formule suivante 
ou D obs represente la valeur mesuree du desequilibre de liaison, D la 
valeur maximale theorique du desequilibre de liaison et r le taux de 
recombinaison : 

Dobs = 0-r)D 

Chez les organismes qui se reproduisent de fagon asexuee et ou par 
consequent n’existe pas en principe de recombinaison genetique entre 
chromosomes parentaux (r = 0), le desequilibre de liaison est maximal 
et egal a 1 (tous les genes sont lies et transmis ensemble sans recom- 
binaison). 

2.8 HEREDITE ET HERITABILITE 

La notion d’heredite designe le processus de transmission des caracte- 
ristiques biologiques d’un parent a sa descendance. Les genes ayant 
comme support chimique principal l’ADN, l’heredite designe par 
consequent le processus de transmission des instructions genetiques 
portees par cette molecule, d’un parent a sa descendance. Certes, ces 
instructions (l’inne) ne sont pas les seules causes des caracteristiques 
biologiques d’un individu puisque Ton sait que des facteurs environ- 
nementaux (1’ acquis) peuvent aussi tout au long de la vie les moduler. 
Mais l’heredite c’est la part genetique au sens strict. 

La notion d’heritabilite fait reference precisement a 1’ estimation de 
cette part genetique en ce qu’elle peut expliquer les differences pheno- 
typiques constatees entre individus d’une meme population. L’herita- 
bilite evalue en quoi la variabilite genetique des individus constituant 
une population peut expliquer la variabilite phenotypique de ces memes 
individus. Plus la variabilite d’un trait phenotypique depend d’un large 
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spectre d’ instructions geniques (de genes) plus son heritabilite au regard 
de chacune des instructions geniques, sera consideree comme faible. 
A quoi s’ajoute egalement la part des facteurs environnementaux dans 
la variabilite phenotypique elle-meme. 

La relation entre genes et environnement 

A 

Evaluer ce qui dans la formation d’un organisme releve des parts respec- 
tives des genes et de 1’ environnement (l’inne et 1’ acquis, la nature et 
la culture) demeure une question centrale de la genetique. On sait 
aujourd’hui, dans ses grandes lignes quelles sont les bases moleculaires 
de l’inne. Les progres accomplis dans la connaissance de la structure des 
genomes et de leur fonctionnement commencent egalement a degager 
quelques pistes pour comprendre comment les facteurs de 1’ environ- 
nement agissent sur les genomes pour moduler leur expression et aj outer 
les multiples degres de liberte qui leur sont propres. Une nouvelle 
dimension de la genetique designee par le terme d’epigenetique se 
construit peu a peu. 

Des aspects deja anciens de la genetique se sont cependant efforces 
d’apprehender dans leur globalite et dans leur diversite, en s’appuyant 
essentiellement sur des approches mathematiques et statistiques les 
relations entre genes et environnement. II s’agit de ce qu’on appelle la 
genetique quantitative et la genetique des populations. 

La genetique quantitative 

La genetique quantitative etudie les caracteristiques biologiques (les 
traits phenotypiques) qui sont mesurables et quantifiables en essayant 
de relier la serie des valeurs constatees et leur distribution (la variabilite 
des phenotypes) aux mecanismes sous-jacents tels qu’ils sont admis par 
une majorite de geneticiens se referant aux bases theoriques actuelles 
de leur discipline (la genetique mendelienne, voir cependant a ce sujet 
le concept controversy de gene, chapitre 1). 

La valeur phenotypique (P) d’un individu resulte de la combinaison 
d’une valeur genotypique (G) et d’un effet environnemental (E) : 

P = G + E. 

La valeur genotypique reunit toutes les instructions geniques ainsi 
que leurs interrelations. C’est pourquoi on subdivise habituellement le 
composant G en un composant A (addition cumulee des effets de 
chaque gene) et un composant D (effet resultant des interactions domi- 
nantes entre genes). L’ action de 1’ environnement se subdivise en une 
composante E strictement environnementale et une composante I 
decrivant les interactions entre genes et environnement : 

P = A + D + E + I. 
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Ces differentes composantes ne sont pas determinees pour un seul 
individu mais pour des populations en evaluant les variances de 
chacune de ces populations : VP = VA + VD + VE + VI. 

En reference a la notion presentee plus haut on definit l’heritabilite 
au sens large d’un trait, soit H 2 comme la part de la variance P (la 
variation phenotypique totale) due a la variance G (VA + VD). Frequem- 
ment le terme d’heritabilite (h 2 ) fait reference a la seule variance additive 
des genes (VA) intervenant dans la formation d’un trait. C’est en ce 
sens qu’on peut dire d’un gene ou d’un locus contenant une instruction 
genique et influengant le trait d’interet qu’il possede une faible ou une 
forte heritabilite. 

Dans 1’ estimation de ces variances il est essentiel de tenir compte 
des relations exactes de parente. Un pere et son fils partage 50 % de 
leurs genes tout comme la mere et le fils. Ce n’est pas par contre le cas 
du pere et de la mere dont les ascendants sont generalement differents. 
De fagon similaire, deux sceurs ont en commun 50 % de leurs genes 
alors que deux demi-sceurs n’en partagent que 25 %. II est necessaire de 
tenir compte de ces differences parentales pour estimer la proportion 
de variance phenotypique totale attribuable a chaque composante de VP. 

S’appuyant sur 1’ analyse des genomes entiers, la genetique quanti- 
tative fait reference aujourd’hui a la notion de QTL. Determiner un 
QTL necessite done de combiner avec le plus de precision possible 
des mesures phenotypiques, genealogiques et genetiques sur un grand 
nombre d’individus. Son domaine d’ action principal conceme done 
les traits variables qui sont determines par un nombre generalement 
assez eleve de genes (ou d’instructions geniques), voir chapitre 5, 
ENCODE et GWAS. 

Parametres statistiques frequemment utilises 
en genetique quantitative 

Une classe inclut tous les individus presentant le meme phenotype 
pour un caractere precis. Dans une population, la moyenne x pour un 
caractere correspond a la somme de toutes les valeurs de ce caractere, 
soit (xi) divisee par le nombre de mesures effectuees (AO : 



A la valeur moyenne d’un caractere est attribute la valeur 0 en 
abscisse. Pour un individu donne, la valeur x de l’ecart a la moyenne 
est positive ou negative selon la valeur phenotypique de cet individu 
par rapport a la classe moyenne. 

La frequence relative j] exprime pour un caractere variable la propor- 
tion des individus («,•) appartenant a une classe (x a ) de ce caractere a 
tous les individus N analyses : 
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La variance (s 2 ) exprime 1’ amplitude de la dispersion des differentes 
classes d’individus (x ? ou classes de caracteres) par rapport a la classe 
centrale, x : 


s 2 = 


^( x i-x) 


N 


La variance s’exprime en unites au carre. L’ecart-type (s) de la 
distribution correspond a la racine carre de la variance. 

La covariance permet d’etablir si chez un individu deux caracteres, 
par exemple X et Y evoluent dans le meme sens. On a : 


cov xy = 




N 


Le coefficient de regression (b xy ) permet de determiner si la valeur 
pour un caractere (Y) depend de celle du caractere (X). C’est la pente 
de la droite Y =/(X), soit : 


b xy = 


_ cov xy 


s 2 (x) 



POINTS CLEFS 


> Pour survivre et se reproduire, les organismes vivants doivent repliquer 
fidelement leur ADN et le proteger des deteriorations physico-chimiques. 

>- Si I'ADN etait absolument invariant, c'est-a-dire replique avec une fidelite 
absolue et done depourvu totalement de mutations, il n'y aurait pas 
devolution des especes vivantes. 

> Un taux eleve de mutations peut permettre a certains organismes d'evoluer 
et done de s'adapter plus rapidement a leur environnement. 

> Les mutations, qu'elles soient spontanees ou provoquees par des deterio- 
rations liees au contexte environnemental, sont principalement dues a des 
erreurs de duplication de I'ADN, non corrigees. 

> A la meiose, des fragments entiers de chromosomes s'echangent, par recom- 
binaison homologue, processus connu sous le terme de « crossing over». 

> La transposition, rearrangements et/ou deplacements de sequences connues 
appeleestransposons,contribuea la plasticite des genomes. 

> Qu'elles soient geniques ou chromosomiques, les mutations ont de multiples 
formes ponctuelles (transitions, transversions) ou plus larges (amplifications, 
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inversions, deletions, translocations, transpositions, recombinaisons diverses). 
Elies peuvent entrainer des pertes d'heterozygotie. 

> Les effets se manifestent generalement par des modifications phenotypi- 
ques mais pas tou jours. Elies peuvent etre favorables, defavorables ou neu- 
tressuivant le contexte environnemental et la selection qui prevaut. 

> La selection est un processus biologique complexe a la base de 1'evolution 
des especes. II se deroule dans la nature (selection naturelle) mais peut 
aussi etre dirige a son profit par I'homme (selection artificielle). 

> La selection naturelle aboutit a ce que les caracteristiques (traits pheno- 
typiques) favorables, transmises entre individus capables de se reproduire 
deviendront de plus en plus frequentes chez les descendants au cours des 
generations successives. Le genotype correspondant deviendra egale- 
ment de plus en plus frequent dans les generations suivantes. 

> La selection naturelle peut se manifester a divers stades du cycle vital d'un 
organisme ayant une reproduction sexuee. 

> La selection naturelle de leurs caracteristiques phenotypiques assure aux 
individus porteurs une excellente adaptation au milieu dans lequel ils vivent 
(niche ecologique). 

> Le maintien d'une selection basee sur un processus interactif entre geno- 
type et milieu peut aboutir finalement a I'emergence d'une nouvelle espece. 
Cette idee simple repose sur le concept d'adaptation et demeure aujourd'hui 
encore a la base de la theorie de 1'evolution des especes vivantes. 

> La selection est un processus qui en eliminant les mutations defavorables 
a une adaptation environnementale reduit la variabilite genetique apportee 
par les mutations. Dans le meme temps, de nouvelles mutations, aleatoires, 
se produisent qui realimentent la variabilite genetique au sein d'une 
population. Une balance, un equilibre s'etablit entre les deux processus 
(vitesse d'apparition des mutations et elimination des mutations defavo- 
rables). De cette balance resulte en quelque sorte la force propulsive de 
1'evolution. 

> Le jeu complexe qui s'etablit entre phenotype, genotype et milieu est 
parfois represente par la relation : genotype + environnement + variation 
aleatoire -» phenotype. 

> Quand les loci de deux genes (alleles) sont lies ou tres proches I'un de 
I'autre sur le meme chromosome, on dit qu'existe une liaison genetique. 

> Les associations non aleatoires entre genes (alleles) a differents loci sont 
mesurees par le degre de desequilibre de liaison. Celui-ci decrit la situation 
qui dans une population resulte de certaines combinaisons d'alleles ou de 
marqueurs genetiques dont la frequence differe de celle qu'on attend 
d'une formation aleatoire d'haplotypes. 

> Les instructions genetiques (I'inne) ne sont pas les seules causes des carac- 
teristiques biologiques d'un individu puisque Ton sait que des facteurs 
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environnementaux (I'acquis) peuvent aussi tout au long de la vie les moduler. 
L'heredite c'est la part genetique au sens strict. 

> La notion d'heritabilite fait reference a I'estimation de la part genetique en 
ce qu'elle peut expliquer les differences phenotypiques constatees entre 
individus d'une meme population. 

> La genetique quantitative etudie les caracteristiques biologiques (les 
traits phenotypiques) qui sont mesurables et quantifiables, en essayant 
de relier la serie des valeurs constatees et leur distribution (la variability 
des phenotypes) aux mecanismes sous-jacents tels qu'ils sont admis par 
une majorite de geneticiens se referant aux bases theoriques actuelles de 
leur discipline. 


QCM - QROC 


2.1 Qu’est-ce que l’heredite ? 

a) Le processus de transmission des caracteristiques biologiques d’un 
parent a sa descendance. 

b) Ce qui peut expliquer les differences phenotypiques constatees entre 
individus d’une meme population. 

c) Ce qui dans la formation d’un organisme releve des parts respectives 
des genes et de l’environnement. 

d) Ce qui appartient a l’inne et ce qui appartient a I’acquis. 

2.2 Qu’est-ce que la selection ? 

a) Un processus qui aboutit a ce que les caracteristiques (traits pheno- 
typiques) favorables, transmises entre individus capables de se repro- 
duce deviennent de plus en plus frequentes chez les descendants au 
cours des generations successives. 

b) Un processus qui aboutit a ce que la frequence d’un allele augmente 
parce que son adaptability sera plus grande que celle des autres alleles. 

c) Un processus qui agit sur le potentiel de variation du genome et 
suivant les circonstances environnementales et l’echelle de temps 
consideree, peut ou non appauvrir la variability intrinseque du genome. 

2.3 Qu’entend-on par l’expression « desequilibre de liaison » : 

a) une distribution non aleatoire de marqueurs genetiques ? 

b) une distribution aleatoire de marqueurs genetiques ? 

c) une absence de marqueurs genetiques ? 

d) une abondance de marqueurs genetiques ? 
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2.4 Citer deux aspects du processus reproductif d’une espece ou peut 
s’exercer la selection. 

2.5 Citer deux exemples de mutations a effet favorable chez l’homme. 

2.6 Citer deux deteriorations chimiques provoquant des mutations. 

2.7 Pourquoi une mutation provoquant un changement de cadre de 
lecture entraine-t-elle plus frequemment qu’une mutation « faux sens », 
la perte de fonction de la proteine correspondante ? 

2.8 Chez un couple sans antecedents familiaux nait un enfant de taille 
normale et un autre atteint de nanisme achondroplasique (arret du deve- 
loppement de certains os), un phenotype autosomal dominant, tres 
etroitement associe a un genotype mutant. Comment expliquer la 
naissance de cet enfant nain ? D’autres enfants de ce couple peuvent-ils 
etre atteints de ce type de nanisme. 


REPONSES 


2.1 a) 

2.2 a), b), c) 

2.3 a) 

2.4 Capacite a se reproduire (ne pas disparaitre avant d’etre capable 
de se reproduire), Competition sexuelle (competition entre adultes 
pour se reproduire), Nombre de descendants (et duree de la periode 
d’ aptitude a la reproduction), Fecondite croisee (fecondite relative male 
et femelle), Viabilite et selection des gametes (suivant les evenements 
de recombinaison mei'otique), Compatibilite des gametes (plus ou moins 
grande compatibilite sperme-ovule). 

2.5 Une mutation ponctuelle de la globine (un acide glutamique est 
substitue par la valine) responsable de l’anemie falciforme (l’agregation 
de l’hemoglobine deforme les hematies qui adoptent une forme en 
faucille et circulent mal). Les porteurs de cette mutation resistent a la 
malaria (paludisme), l’agent infectieux de cette maladie ( Plasmodium ) 
etant mal transports . 

Une deletion de 32 bases dans le gene codant un recepteur de cyto- 
kines (CCR5), exprime preferentiellement dans les lymphocytes T, les 
macrophages et les cellules dendritiques. Ce recepteur, utilise par le 
VIH (virus du sida) comme corecepteur pour coloniser les lympho- 
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cytes T, est non fonctionnel sous sa forme mutee (CCR5-A32) et confere 
aux porteurs homozygotes une resistance a 1’ infection par le VIH. 

2.6 L’hydrolyse spontanee de la liaison N-glycosidique unissant les 
bases puriques au desoxyribose cree des pseudo-nucleotides sans 
guanine ou adenine, dits apuriniques qui bloquent la replication. Si 
malgre tout une base est inseree en face de tels pseudo-nucleotides, il 
y a une chance sur quatre qu’elle soit erronee cream ainsi une mutation. 
L’hydrolyse spontanee des groupes NH 2 de la cytosine ou de la 5-methyl- 
cytosine donne naissance respectivement a l’uracile et a la thymine. 
Elies s’apparieront alors apres un cycle de replication avec 1’ adenine 
et non plus avec la guanine creant ainsi une mutation ponctuelle par 
transition. La 7,8-dihydro-8-oxoguanine (oxoG) formee par certains 
radicaux libres oxygenes, s’apparie aussi bien avec la cytosine que 
1’ adenine, provoquant dans ce dernier cas une des mutations par trans- 
version les plus frequemment rencontrees a l’origine de certains cancers 
humains. 

2.7 Le changement de cadre de lecture resulte au minimum de la 
deletion ou de l’addition d’une base (jamais de trois bases ou d’un 
multiple de trois). Du site de la mutation jusqu’a l’extremite de la 
proteine, la sequence en amino-acides s’en trouve modifiee, avec tres 
souvent aussi la possibility d’apparition d’un codon stop premature et 
la formation d’une proteine tronquee. La mutation « faux sens » 
change uniquement le sens du codon concerne et done un seul amino 
acide. 

2.8 L’ allele responsable de ce nanisme doit etre apparu spontanement 
dans la lignee germinale de Fun des parents. La survenue d’un autre 
enfant atteint de nanisme depend du stade auquel la mutation est 
intervenue (cellule souche de la lignee germinale ou gametes). Si les 
cellules souches (2 n chromosomes) de la lignee germinale de Fun 
des parents ont mute spontanement, la moitie des gametes ( n chromo- 
somes) seront susceptibles d’etre porteurs et la probability de survenue 
d’un autre enfant nain sera de 1/2. Elle sera nulle, si l’evenement de 
mutation initial est intervenu apres la meiose ayant produit les gametes 
porteurs. Elle sera comprise entre 0 et 0,5 selon la proportion de 
gametes atteints aux autres stades possibles de mutation. 
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3.1 La structure de I'ADN 

3.2 La structure et la fonction des chromosomes eucaryotes 

3.3 La structure des genomes 

3.4 Le sequence des genomes 



Analyser dans ses principaux aspects la structure en double helice de I'ADN 

Analyser dans leurs principaux aspects la structure et la dynamique 
des nucleosomes et de la chromatine 


co 
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> Repertorier les principaux aspects de la structure et de I'organisation 
des differents genomes 


3.1 LA STRUCTURE DE L'ADN 
Nucleotides et polynucleotides 

La structure d’un polynucleotide (polymere de nucleotides) repose 
sur la formation d’un nombre parfois eleve (plusieurs millions) de 
liaisons phosphodiester entre les nucleotides constitutifs (voir le Mini 
Manuel Biologie moleculaire). Chaque liaison phosphodiester s’etablit 
entre le groupe OH du carbone 3’ d’un pentose et le groupe OH porte 
par le carbone 5’ du pentose suivant. C’est la liaison phosphodiester 
3 ’-5’. II en resulte que l’orientation du polynucleotide se trouve definie 
par la position du groupe phosphate libre du premier nucleotide, 
generalement le phosphate porte par le carbone 5’, et par le groupe 
OH libre porte par le dernier nucleotide, generalement le phosphate 
porte par le carbone 3’. On dit ainsi que le polynucleotide est oriente 
dans le sens 5’ vers 3’. 

L’ADN est un acide nucleique bicatenaire, c’est-a-dire constitue 
de deux brins polynucleotidiques associes par des liaisons hydrogene 
entre les bases puriques et pyrimidiques constitutives des nucleotides. 
Les liaisons hydrogene s’etablissent toujours entre une purine de l’un 
des brins et une pyrimidine de 1’ autre brin. Dans cet appariement comple- 
mentaire, l’adenine (A) est done toujours associee a la thymine (T) 
par deux liaisons hydrogene et la guanine (G) interagit toujours avec 
la cytosine (C) grace a trois liaisons hydrogene (Fig. 3.1). Ainsi, dans 




Copyright © 2015 Dunod. 


62 


Chapitre 3 • Structure des genes et des genomes 



Tableau 3.1 Composition en bases de l'ADN de differentes origines. 


Originede l'ADN 

Bases (%) 

(A + T)/(G + C) 

(A + G)/(T + C) 

A 

G 

C 

T 

Bacteriophage T7 

26,0 

23,8 

23,6 

26,6 

1,11 

0,99 

Escherichia coli B 

23,8 

26,8 

26,6 

23,1 

0,88 

1,01 

Neurospora 

23,0 

27,1 

26,6 

23,3 

0,86 

1,00 

Drosophile 

30,7 

19,6 

20,2 

29,5 

1,51 

1,01 

Saumon 

28,0 

22,0 

20,0 

27,8 

1,33 

1,05 

Poule 

28,0 

22,0 

21,6 

28,4 

1,29 

1,00 

Rat 

28,6 

21,4 

21,6 

28,4 

1,33 

1,00 

Vache 

27,3 

22,5 

22,5 

27,7 

1,26 

0,99 

Homme 

29,3 

20,7 

20,0 

30,0 

1,46 

1,00 
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Extremite 5' 


H OH 
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Extremite 3' 


b) 



Extremite 3' 


Extremite 5' 


Figure 3.2 Structure des appariements complementaires de deux brins anti- 
paralleles d'ADN. a) representation developpee ; b) representation simplifiee. 
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1’ ADN, la quantite des purines (A + G) est egale a celle des pyrimidines 
(C + T). Par contre le rapport A + T sur G + C varie selon l’origine de 
l’ADN ( Tableau 3.1 et voir le Mini Manuel Biologie moleculaire, 
Tableau 1.1). Le principe d’appariement complementaire des bases 
a une grande valeur pratique. II permet au geneticien de determiner la 
sequence nucleotidique d’un brin d’ADN a partir de celle du brin 
complementaire, qu’il s’agisse d’un brin ADN ou d’un transcrit ARN. 
L’ orientation d’un brin polynucleotidique est definie par la presence 
des groupes chimiques 5 ’-phosphate et 3 ’-OH portes par les carbones 
5’ et 3’ des deux desoxyriboses extremes (Fig. 3.2). Dans la double 
helice d’ADN, les deux brins complementaires sont orientes en sens 
inverse. On dit qu’ils sont antiparalleles. 

La double helice 

L’association des deux brins par des liaisons hydrogene provoque une 
contrainte physique qui impose a 1’ ensemble 1’ adoption d’une struc- 
ture en double helice (Fig. 3.3). Dans le modele original, propose par 
James Watson et Francis Crick en 1 953, la double helice a un diametre 
de 2 nm et presente deux periodicites. La premiere de 0,34 nm corres- 
pond a la distance separant deux plateaux de bases appariees. La 
seconde de 3,4 nm correspond au pas de 1’ helice qui couvre une 
longueur de 10,5 plateaux de bases (Fig. 3.3 ). A la surface de la molecule 




Sillon 
majeur 
(1,2 nm) 


-iar r 


Sillon mineur 
(0,6 nm) 



Sens d’enroulement 


Figure 3.3 Representation d'un fragment d'ADN en double helice. 

A gauche, avec les plateaux de bases ; a droite, les atomes sont represents avec leurs 
rayons deVan der Waals. 
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Figure 3.4 La dissociation de TADN et sa reassociation depend de sa teneur en G + C. 

a) Representation simplifiee du processus de dissociation-reassociation de TADN sous 
Taction d'agents denaturants; b) representation simplifiee de la courbe sigmoide, 
temoin du processus de dissociation. La formule etablit la relation entre la teneur en 
G + C de I'ADN et la temperature de fusion de I'ADN ;c) droite reliant la teneur en G + C 
et la Tm (Temperature de fusion) de divers organismes. 
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d’ADN, les deux brins torsades menagent deux sillons helicoi'daux 
de largeur differente, un sillon majeur ou grand sillon et un sillon mineur 
ou petit sillon (Fig. 3.3). Ces deux sillons, tout particulierement le 
grand sillon, exposent de nombreux groupes chimiques avec lesquels 
interagissent dans les conditions physiologiques de la cellule des 
proteines dites de liaison a l’ADN. Ces proteines assurent des roles 
majeurs de regulation de 1’ expression de 1’ information genetique portee 
par la sequence en bases proprement dite. Sous sa forme bicatenaire 
(en double helice) l’ADN absorbe moderement la lumiere UV. Apres 
dissociation des deux brins, le demasquage des bases qui en resulte, 
provoque une absorption plus marquee de la lumiere UV. L’enregis- 
trement du phenomene a 260 nm fournit une courbe en forme de 
sigmoide, typique du phenomene (Fig. 3.4). La dissociation thermique 
de l’ADN et sa reassociation par refroidissement est une technique de 
base utilisee dans la reaction de polymerisation en chaine (PCR, voir 
la technique PCR dans le Mini-manuel Biologie moleculaire ). 

Sous la forme lineaire souvent observee dans la plupart des cellules, 
les extremites de f ADN sont libres et les contraintes physiques intro- 
duces par ses divers ligands sont, pour cette raison, facilement ajustees. 
L’ADN peut cependant exister sous une forme circulaire, c’est-a-dire 
sans extremites libres. C’est le cas de l’ADN bacterien, de beaucoup 
d’ADN viraux et de 1’ADN mitochondrial (Tableau 3.2). C’est aussi 
le cas des plasmides, petits chromosomes bacteriens surnumeraires 
capables de s’autorepliquer de fa^on autonome. L’ADN circulaire 
subit des contraintes physiques qui ne sont reduites pour stabiliser 
1’ ensemble que par un jeu de surenroulements parfois nombreux. Quel 
que soit l’ADN, 1’ orientation des genes depend pour chaque gene de 
l’orientation du brin effectivement transcrit (orientation 3’ —> 5’). Les 
deux brins peuvent etre porteurs de 1’ information transcrite (Fig. 3.5 ). 
Des chevauchements existent parfois entre genes dont l’orientation 
est opposee. 

Dans 1’ ADN de tres grande longueur des cellules eucaryotes, malgre 
la linearite de la molecule, les contraintes topologiques demeurent 
au sein de la chromatine. II est done important que ces contraintes 
soient reduites afin que les processus fondamentaux que sont la repli- 
cation et la transcription de l’ADN soient possibles. Une classe speciale 
d’ enzymes, nominees topoisomerases, peut introduire des cassures 
specifiques dans l’un ou l’autre brin ou meme les deux. Ces cassures 
reduisent les contraintes, relachent les surenroulements et rendent 
possibles les processus physiologiques. Ceci est particulierement 
important lors de la separation des deux molecules d’ADN resultant 
de la replication, qui sont encore liees 1’ une a 1’ aulre avant leur adressage 
aux deux cellules produites par la division cellulaire. 
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Gene 1 Gene 2 Gene 3 Gene 4 

I 1 I 1 I 1 I 1 

r 5 ' t =i 1=7 / 1 1 / A=i 1 ! > 3 ' 

o' ^ c' o' ^ c' 


L 3' <! I ■ 1 Z Al ^ 5' 

5' » 3' 5' > 3' 

Figure 3.5 Orientation des genes suivant que la sequence codante se trouve sur 
I'un ou I'autre brin de la double helice. 


T ableau 3.2 Genomes de divers organismes : 

STRUCTURE, TAILLE ET ESTIMATION DU NOMBRE DE GENES. 
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Genome Groupe 


Structure Taille (kb) N° mbre 

du genome de genes 


Eucaryotes : 

Saccharomyces 
cerevisae 
Caenorhabditis 
elegans 
Arabidopsis 
thafiana 
Homo sapiens 


Procaryotes : 

Escherichia coli 
Haemophilus 
influenza 
Methanococcus 
jannaschii 


Virus : 

Virus T4 

HCMV (virus 
de I’herpes) 


Organites 

Mitochondrie 
de S. cerevisae 
Mitochondrie 
de H. sapiens 
Chloroplaste 


Levures 

VAA-nr- 

— n — i — i — rHW 

Nematode 

' 1 1 1 1 

rm — rm 

U 1 1 ■— n — 1 "N. 

t— \_ ruri— l — 

Plante 

Humain 

C r 1 — 

J M_H_I— 1 r 

1 1 1 — n — i — i 

NhhhhH — 

— LU — L- 1 — 1 — n£/s 


Bacterie 

Bacterie 

Bacterie 



Virus 

bacterien 

Virus 

eucaryote 



Levure 

Humain 

Plante 



13 500 (L) 

6 000 

100 000 (L) 

13 500 

120 000 (L) 

25 000 

3.106 (L) 

28 000 

4 700 (C) 
1 830 (L) 

4 000 
1 703 

1 660 (L) 

1 738 


172 (L/C) 300 

229 (L) 200 


78 (C) 

34 

17(C) 

37 

121 (C) 

136 


□ Sequences repetees L : Lineaire 

□ Introns C : Circulaire 

□ Exons 
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3.2 LA STRUCTURE ET LA FONCTION 
DES CHROMOSOMES EUCARYOTES 

La structure du nudeosome 

Dans les cellules eucaryotes, a la difference des procaryotes, l’ADN 
est tres frequemment associe a des proteines basiques, les histones. 
Le resultat de 1’ assemblage regulier entre ADN et histones est designe 
par le terme de nudeosome (Fig. 3.6). 

La formation des nucleosomes est la premiere etape d’un processus 
qui assure l’empaquetage de V ADN en structures compactes reduisant 
enormement le volume occupe par la molecule. L’ensemble est designe 
sous le terme de chromatine. 



Figure 3.6 Structure simplifiee d'un nudeosome. 

a) I'octamere d'histones ; b) I'enroulement de I'ADN autour de I'octamere et sa conso- 
lidation par I'histone HI ; c) protuberance vers I'exterieur des queues N-terminales 
d'histones de I'octamere. 

Chacune des classes d’histones est constitute de petites proteines 
riches en amino-acides charges positivement (lysine et arginine). Leurs 
sequences en amino-acides sont restees remarquablement identiques 
au cours de 1’evolution. Les histones H2A, H2B, H3 et H4 (11 a 15 kd) 
sont en quantite egale et chacune en double exemplaire, elles forment 
un octamere d’histones (Fig. 3.6 a) constituant un « coeur » proteique 
discoide de 8 proteines autour duquel I’ADN nucleosomal d’une 
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taille de 147 paires de bases est enroule (Fig. 3.6b). L’histone HI (20 kd) 
ne fait pas partie du « coeur ». Elle est attachee d’une part, a 1’ ADN de 
liaison situe entre les nucleosomes et, d’ autre part, a l’ADN nucleo- 
somal ce qui a pour effet de consolider 1’ ensemble (Fig. 3.6 et 3.7). 


Nucleosome 

i 1 




Figure 3.7 Representation simplifiee d'un enchainement de trois nucleosomes 
montrant le role de I'histone HI dans le resserrement de I'ADN autour de I'octa- 
mere d'histones. 

in 

T 1 

O 

De nombreux contacts existent entre les histones de 1’octamere et 
1’ ADN nucleosomal. Ils sont independants de la sequence en bases de 
I’ADN, ce qui explique que la presque totalite de I’ADN des cellules 
eucaryotes est organisee en nucleosomes. Les histones du coeur 
possedent des extremites libres du cote N, designees par le terme de 
« queues ». Ces queues emergent du nucleosome en des positions tres 
precises (Fig. 3.6 c). Elies facilitent la formation des structures 
d’ordre superieur resultant des surenroulements de nucleosomes 
donnant la structure finale de la chromatine. Certains amino-acides 
des queues d’histones sont parfois modifies par des groupes acetyle 
et methyle (lysine, arginine) ou phosphate (serine). Ces modifications 
facilitent ou alterent 1’ accessibility de la chromatine. Elies constitue- 
raient un « code epigenetique » qui pourrait etre lu par les proteines 
impliquees dans la regulation de 1’ expression des genes et dans les 
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di verses autres fonctions de l’ADN. Les nucleosomes sont des struc- 
tures dynamiques, constamment modifiees par de nombreux 
complexes proteiques de remodelage capables de les deplacer le long 
de la molecule d’ADN, de les transferer d’une molecule d’ ADN a une 
autre ou de les modifier afin d’accroTtre 1’ accessibility de l’ADN. 

La structure et le remodelage de la chromatine 

La presence de 1’ histone HI consolide et resserre la structure du 
nucleosome. Chaque portion d’ADN nucleosomal represente alors 
160 pb. L’histone HI favorise aussi la formation de la structure tres 
condensee qui aboutit a empaqueter dans un noyau de 10 -5 metre 
environ de diametre, les 1 a 2 metres d’ADN de chaque cellule de 
mammifere ! De recentes analyses biophysiques tres performantes 
(tomographie par microscopique electronique, cryo-microscopie 
electronique, diffraction des rayons X aux petits angles) montrent 
cependant une certaine elasticity de la chromatine dont la structure 
peut se comparer a une tresse a laquelle 1’ADN contribuerait 
d’ailleurs autant que les proteines. Les observations indiquent que 
dans cette tresse, les fibres de chromatine s’entrecroisent et sont a de 
frequents intervalles liees entre elles par un complexe proteique de 
condensine jouant le role de liant. Aucune organisation hierarchique 
n’etant observee avec ces techniques modernes, la structure la plus 
probable serait celle d’une chaine de nucleosomes dont 1’ auto-organi- 
sation serait modulee par les seules contraintes dues au complexe 
proteique de la condensine. Le remodelage de cette structure par les 
nombreux complexes proteiques specialises serait la condition 
absolue de l’expression genique. 

La structure des chromosomes au cours du cycle cellulaire 

Dans les cellules eucaryotes, le chromosome est le stade visible 
d’ organisation de la chromatine a la metaphase de la mitose. Le nombre 
de chromosomes et leur composition sont des caracteristiques de 
chaque organisme. 

Le sequen^age complet d’un certain nombre de genomes a montre 
que la quantity d’ADN effectivement utilise pour coder les proteines 
ou les ARN varie enormement d’un organisme a un autre. Chez les 
bacteries, la presque totalite de l’ADN code des proteines. Chez les 
mammiferes, seule une petite portion (moins de 10 %) code reellement 
les proteines ou les divers ARN, le reste ou ADN intergenique, est 
constitue largement de sequences repetees (souvent des dinucleotides), 
appelees microsatellites (3 %) ou composees de grands elements de 
sequences transposables (plus de 50 %). Beaucoup d’interrogations 
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demeurent encore aujourd’hui sur les fonctions exactes de l’ADN 
intergenique (voir chapitre 5, ENCODE). 

Pour etre maintenu comme tels au cours de la division cellulaire, 
chaque chromosome eucaryote doit posseder un centromere, des 
telomeres et plusieurs origines de replication. Les origines de repli- 
cation sont les nombreux sites (3000 par chromosome en moyenne) 
ou s’assemblent les divers composants proteiques, dont les ADN 
polymerases, necessaires au demarrage de la replication (duplication 
de l’ADN) operation qui precede la division cellulaire. Les centro- 
meres sont des sequences d’une taille superieure a 40 kb au contact 
desquelles se construit le kinetochore, un complexe proteique neces- 
saire a la separation et l’adressage corrects des deux chromosomes-fils 
aux deux cellules filles (voir Mini Manuel de Biologie cellulaire). 

II est essentiel qu’un seul centromere soit present par chromosome. 
Dans le cas contraire, il en resulte des cassures, des pertes ou des 
duplications de chromosomes dont les consequences sont generalement 
graves. 

Les telomeres sont des sequences particulieres localisees aux deux 
extremites du chromosome. Elies sont reconnues par des proteines 
specifiques qui protegent le chromosome des evenements de recombi- 
naison ou de degradation typiques des extremites ADN libres. A 
l’endroit des telomeres se trouve une origine de replication particuliere 
reconnue par une ADN polymerase speciale, la telomerase, qui 
replique un certain nombre de fois la sequence correspondante. 

La duplication du chromosome puis sa segregation s’opere dans 
des phases distinctes du cycle cellulaire. On distingue dans l’ordre 
4 phases : Gl, S, G2 et M (Fig. 3.8). 

Au cours de la phase S s’opere la synthese de 1’ ADN conduisant a 
la duplication des chromosomes en deux chromatides sceurs mainte- 
nues ensemble par un complexe proteique appele cohesine, jusqu’a la 
segregation. 

Celle-ci s’opere durant la phase M (pour mitose). Chaque chromatide 
s’ attache grace au kinetochore au fuseau mitotique fait de proteines 
fibreuses appelees microtubules reunies aux centrosomes situes aux 
deux poles de la cellule. La desagregation de la cohesine favorise la 
separation des deux chromatides soeurs. L’ensemble des operations 
est soigneusement coordonne afin que la separation assure un trans- 
fert complet et efficace des informations genetiques portees par les 
deux chromosomes-fils. 

Les phases Gl et G2 (G pour gap) sont des phases d’attente et de 
preparation ou des mecanismes de controle du cycle operent, qui 
autoriseront ou non sa poursuite jusqu’a son terme. 
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Figure 3.8 Evenements du cycle cellulaire (a) et quantite d'ADN (b). 


Au cours du processus complet de la division cellulaire, l’etat de 
condensation des chromosomes varie profondement. Durant les phases 
Gl, S et G2 (groupees sous le terme d’ interphase) il est plus faible 
que durant la phase M bien que des changements discrets se produisent 
constamment. 

3.3 LA STRUCTURE DES GENOMES 
QiTest-ce qu'un genome ? 

On designe par le terme de genome (contraction des mots gene et 
chromosome) I’ensemble des informations genetiques, codees par 
1’ADN chez la plupart des organismes et parfois par l’ARN pour 
certains virus et qui sont hereditairement transmissibles. De fagon 
plus precise, le terme designe la sequence de 1’ ADN correspondant a un 
jeu haploide de chromosomes (n chromosomes). Une cellule somatique 
humaine, diploide (2 n chromosomes), contient done deux genomes 
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(un genome paternel et un genome maternel) alors qu’une cellule 
germinale (sexuelle), haploide (ovule ou spermatozoide), en contient 
un seul. Le terme genome s’ applique aussi bien a l’ADN du noyau 
cellulaire (genome nucleaire) qu’a l’ADN des organites (genome 
mitochondrial, genome chloroplastique). Parler du sequen^age du 
genome d’une espece signifie que l’ordre des nucleotides constituant 
1’ ADN du jeu haploide des chromosomes non sexuels (autosomes) et 
sexuels - male et femelle - est etabli ou en cours de l’etre. On parle de 
genomique (contraction des mots genome et informat/gwc) pour 
designer F etude a grande echelle des proprietes generates des genomes 
grace a des moyens informatiques de plus en plus puissants. Les 
premieres questions interessant F etude des genomes portent sur leur 
taille, le nombre de genes qu’ils contiennent (au sens classique du 
concept), le nombre de chromosomes constitutifs et la maniere dont 
les genes sont distribues ou organises. 

La taille des genomes 

Pour designer la taille d’un genome on utilise habituellement une unite 
exprimant le nombre de paires de nucleotides. Pour le millier de paires 
de nucleotides ou de bases soit 10 3 , l’unite est la kilopaire de bases 
ou Kpb, pour le million soit 10 6 , l’unite est la megapaire de bases ou 
Mpb. On pensait generalement qu’il existait une relation progressive 
entre la taille des genomes, le nombre de genes qu’ils contiennent et la 
complexity des groupes d’organismes vivants (Fig. 3.9 et Tableau 3.2). 
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Figure 3.9 Quantite d'ADN present dans les genomes de differents groupes 
d'organismes. 
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En verite, plus la connaissance intime de la structure et du fonction- 
nement des genomes progresse plus cette relation s’avere inexacte. 
D’une part, la notion meme de « complexity » n’est pas tres operation- 
nelle (une plante a fleurs ou une grenouille sont-elles plus complexes 
qu’un humain ?) ; d’autre part, 1’ organisation des instructions genetiques 
au sein des genomes et surtout leur mode d’ expression semblent a la 
fois tres diversifies et variables selon les organismes. 

Les genomes viraux 

Bien que les virus ne soient pas consideres comme des organismes 
vivants mais comme des parasites moleculaires, ils se reproduisent en 
infectant des cellules vivantes dans lesquelles ils injectent leur genome 
constitue par de l’ADN double brins ou parfois simple brin, protege 
au sein d’une particule ou capside de nature proteique. Certains virus, 
comme les retrovirus auxquels se rattache par exemple le VIH, ont un 
genome constitue d’ ARN, qui se presente soit sous la forme d’un seul 
brin ou d’un double brin. Quel que soit l’acide nucleique, il est pour 
certains virus, sous une forme lineaire et pour d’autres, sous une forme 
circulaire. Dans tous les cas, le genome viral existe au moins dans une 
des phases de son cycle cellulaire sous la forme d’un ADN double brins. 

Les genomes procaryotes 

Le genome de la plupart des organismes procaryotes correspond a un 
seul chromosome compose d’un ADN souvent circulaire et de tres 
peu de proteines associees. Une bacterie en cours de division peut 
cependant contenir simultanement plusieurs copies de ce chromosome 
unique. Entre les genes bacteriens il y a peu d’espaces intergeniques. 
Les genes sont souvent organises en unites, les operons, transcrits en 
un seul ARN messager (voir le Mini Manuel, Biologie moleculaire ). 
L’ADN associe a quelques proteines forme une masse dense, le 
nucleoide qui se desorganise en un echeveau filamenteux lorsque la 
cellule est broyee. 

Les genomes eucaryotes 

Les especes eucaryotes sont soit diploides (les cellules somatiques des 
animaux et plantes a fleurs possedent dans leur noyau, deux jeux -2 n 
- de chromosomes) ou haploides (un seul jeu - n - de chromosomes par 
noyau cellulaire chez la plupart des champignons et les algues). Les 
organismes diploides produisent generalement des cellules specialises 
haploides (n chromosomes) pour la reproduction (ovule et spermato- 
zoi'de chez les animaux) alors que les organismes haploides peuvent 
presenter au cours de la phase sexuee de leur cycle vital des cellules 
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specialises a 2 n chromosomes. Le nombre n de chromosomes 
presents dans les cellules d’un organisme definit le niveau de ploidie. 
Certains organismes (vegetaux souvent) presentent des niveaux de 
ploidie eleves (polyploi'die). Dans une cellule diploide, les chromo- 
somes s’associent en paires de chromosomes homologues, chaque 
chromosome possedant une taille et un nombre de genes identiques aux 
memes positions. Cependant une paire de chromosomes peut porter 
deux alleles differents d’un meme gene (voir plus haut). Le terme de 
caryotype est utilise pour designer le nombre de chromosomes, etabli 
par l’observation microscopique d’une cellule en metaphase. 

Au sein d’une espece, les chromosomes peuvent differer fortement 
en taille. Chez l’homme ( Tableau 3.3) les chromosomes 1 et 2 ont une 
grande taille alors que les chromosomes 21 et 22 sont quatre fois plus 
petits. Pour mieux les analyser, le cytogeneticien classe les chromo- 
somes d’un organisme suivant leur appartenance a un groupe de taille 
(de A a G chez l’homme). La position du centromere (voir plus haut) 
qui apparait souvent sous la forme d’une constriction chez le chromo- 
some metaphasique, divise le chromosome en deux bras. Le plus court 
est appele p et le plus long q . Le cytogeneticien utilise cette nomen- 
clature pour donner la position d’un gene sur les bras d’un chromosome. 
On dit d’un chromosome qu’il est telocentrique (ex. : HSA21, 
tableau 3.3 ) si le centromere est situe a une extremite, acrocentrique 
(ex. : HSA6) s’il est proche d’une extremite et metacentrique (ex. : 
HSA1 ) s’il est situe vers le milieu. 

Tableau 3.3 Principai.es caracteristiques des chromosomes humains. 
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Les genomes cTorganites 

v 

A cote des chromosomes nucleaires qui represented l’essentiel du 
genome d’un organisme eucaryote, certains organites (les mitochon- 
dries et les chloroplastes, presents parfois en grand nombre dans une 
cellule) possedent des chromosomes sous la forme de petites mole- 
cules d’ADN circulaires, d’une taille moyenne avoisinant 10 4 a 10 5 
paires de bases, souvent en de nombreuses copies identiques par orga- 
nite. Pour ces raisons, il arrive que selon les organismes, le nombre de 
chromosomes d’ organites par cellule s’avere tres eleve jusqu’a 
plusieurs centaines parfois. En general, les chromosomes d’organites 
possedent de l’ordre de 50 a 100 genes, dont certains avec des introns. 
Ces genes sont specifiques des fonctions assurees par l’organite lui- 
meme. Mais beaucoup des fonctions de 1’organite sont specifiees par 
des genes nucleaires sans qu’il y ait de redondance entre les genes des 
deux compartiments, mais plutot une complementarite. Selon la 
theorie endosymbiotique relative a l’origine des cellules eucaryotes, 
mitochondries et chloroplastes seraient d’anciennes bacteries ayant 
colonise une cellule hote elle-meme descendante de la premiere cellule 
vivante (voir le Mini Manuel Biologie cellulaire dans cette serie). Au 
cours de 1’ evolution, beaucoup des genes de ces bacteries ancestrales 
symbiotes ont ete transferes dans les chromosomes nucleaires de 
1’hote ou parfois tout simplement perdus. II n’en demeure pas moins 
que les benefices de la symbiose sont suffisamment forts pour que ces 
organites aient ete conserves au cours de devolution. 

3.4 LE SEQUENCE DES GENOMES 

Puisque les instructions qui gouvement la formation et le fonctionnement 
des etres vivants sont contenues dans la sequence de la molecule 
d’ADN, presente au cceur de toutes les cellules vivantes, il est apparu 
tres tot, apres la decouverte du code genetique dans les annees 1960, 
que la connaissance precise de la sequence specifique de chaque espece 
vivante, constituerait un pas decisif vers le decryptage de questions 
aussi capitales que celles de l’origine et de devolution du vivant. Des 
pionniers s’illustrerent dans la mise au point des methodes de sequen- 
9 age (le principe du sequen^age est presente dans le Mini Manuel 
Biologie moleculaire), mais il fallut attendre la mise au point de 
machines perf orman tes et les progres de Pinformatique pour que les 
premieres sequences soient etablies. 

Fragmenter puis assembler 

Les debuts furent modestes. En 1976, la sequence du tout petit genome 
du bacteriophage MS2 fut etablie, suivie en 1977 de la sequence du 
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phage 0X174. C’est a cette occasion que commen 9 a a etre resolue la 
question centrale encore presente aujourd’hui pour toute demarche de 
sequen^age. Pour sequencer des molecules d’ADN composees d’un 
alignement de millions ou de milliards de nucleotides, il s’avere 
indispensable de fragmenter au prealable la molecule. Mais cette 
operation fait disparaitre Finformation de sequence qui est precisement 
capitale pour l’exploitation des resultats. La solution de cette diffi- 
culty est venue de l’utilisation d’algorithmes informatiques capables 
de combiner les informations de sequence et de reconstituer a partir 
de petits fragments d’ADN (environ 500 pb), facilement sequen^ables, 
la sequence complete d’un genome de grande taille. Cette technique 
dite du « shotgun » connue un grand succes et fut appliquee, a partir 
des annees 1990, pour les tres grands genomes comme celui de 
l’homme, grace aux progres de l’automatisation du sequen^age et des 
logiciels d’assemblage informatique. Les fragments assembles en 
plus grandes regions genomiques par cette methode sont denommes 
« contigs ». Ce terme particulier rappelle qu’il s’agissait bien de 
reconstituer par 1’ assemblage de fragments contigus, la continuity de 
la sequence d’origine. De fa 9 on alternative, le developpement des 
techniques de clonage moleculaire ont permis d’obtenir de grandes 
quantites de chacun des fragments engendres par coupure enzymatique 
a l’aide d’ endonucleases de restriction ou par cisaillement physique. 
Des banques furent ainsi constituees a partir desquelles le sequen 9 age 
des fragments pouvait etre organise et repete autant de fois qu’il le 
fallait afin de securiser les resultats (Fig. 3.10 et 3.1 1). 

^ Le sequen^age du genome humain 

o 

c 

Ces techniques furent appliquees au sequen 9 age du genome humain 
dont le projet fut considere par les autorites internationales comme 
relevant du franchissement d’une nouvelle frontiere de l’humanite. 
Son cout fut evalue a 3 milliards $ (2,25 milliards €). Ce sequen 9 age a 
ete realise concurremment par plusieurs equipes organisees autour 
d’un consortium public reunissant plusieurs institutions de differents 
pays sous la conduite du National Human Genome Research Institut 
americain dirige par Francis Collins et par une entreprise privee 
americaine (Celera Genomics) dirigee par Craig Venter. Les premiers 
utiliserent principalement la technique basee sur F organisation de 
contigs de BAC (Chromosome artificiel bacterien contenant un 
fragment aleatoire du genome humain, voir Fig. 3.11), preservant ainsi 
au maximum l’ordonnancement de la sequence. Les seconds appli- 
querent a ce grand genome la technique de la fragmentation aleatoire 
dite du « shotgun ». L’essentiel de la sequence (92 %), constituee 
d’environ 3 milliards de paires de bases, fut obtenue et publiee conjoin- 
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Chromosome 



Figure 3.1 0 Construction et exploitation d'une banque de fragments d'ADN clones. 

L'ADN du chromosome, obtenu lui-meme par tri chromosomique en cytometrie de 
flux est prealablement extrait puis f ragmente par des enzymes de restriction. Plusieurs 
categories d'enzymes de restriction sont employees afin d'obtenir plusieurs types de 
fragments de restriction pour une meme sequence. Tous les fragments obtenus sont 
clones et mis en culture dans des boites speciales a multiples puits de culture afin de 
constituer la banque de reference. Chaque clone est ensuite identifie soit par sa carte 
de restriction, soit par le sequengage de ses extremites puis les clones sont apparies et 
ordonnes en contigs en exploitant les chevauchements de sequences qui leur sont 
communes. Les differents fragments constituant les contigs peuvent etre sequences 
entierement et la sequence complete de I'ADN du chromosome sera reconstitute par 
un assemblage realisant a I'aide de I'inf ormatique des contigs de contigs. La methode 
dite du « shotgun » consiste a fragmenter en morceaux detres petite taille I'ADN chromo- 
somique, a cloner les fragments puis a les sequencer directement, I'assemblage des 
sequences obtenues s'operant par le biais de I'informatique pourvu que la puissance des 
logiciels soit suffisante pourtraitersimultanementdes millions d'informations unitaires. 


tement en 2003. Les 8 % restants correspondent a des regions hautement 
repetees (centromeres et telomeres) ainsi qu’a des regions contenant 
des families multigeniques dont on ne sait pas encore si elles pourront 
reellement un jour etre entierement sequences. 
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Figure 3.1 1 Recapitulation des operations successives necessaires a I'obtention 
de la sequence complete de I'ADN d'un chromosome. 

On notera id le passage par des BACs (chromosome bacterien artificiel contenant des 
fragment de I'ADN a sequencer d'assez grande taille allant de 4. 1 0 4 a 3.10 s ) ce qui 
facilite la construction de contigsde grande taille et ameliore le rendement general de 
I'operation de sequence de chaque chromosome. 


Le postsequen^age 

L’un des objectifs du projet de sequence du genome consistait 
egalement a identifier au sein de cet ensemble enorme de donnees, 
celles qui definissent les genes au sens classique du concept (les 
sequences codant des proteines). Cet aspect du projet reste encore 
ouvert (Fig. 3.12). Le nombre total de genes n’est pas encore etabli 
avec precision. II se situerait autour de 25 000, soit beaucoup moins 
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que ce qui etait attendu (environ 200000) sur la base d’un raisonnement, 
qui s’est revele faux, liant le nombre de genes a la complexity 
supposee de 1’organisme etudie. 



| Regions geniques ou associees 


Regions intergeniques 


Figure 3.12 Differents types de sequences au sein du genome humain. 

La majorite des sequences ne codent pas des proteines. Seules 1,5 % des sequences 
soit 48 megabases sur 3 200 pour le genome complet, correspondent a des exons au 
sein de genes codants. 


Un autre objectif du projet consistait a developper les methodes de 
sequengage afin de progresser vers 1’ application de methodes permettant 
de deboucher sur une exploitation industrielle assurant des applications 
systematiques et a faible cout dans le domaine de la sante notamment 
(voir plus loin et chapitre 5.6, voir aussi particulierement le chapitre 6 
du Mini-manuel Biologie moleculaire ). 

La sequence etablie de l’ADN humain est aujourd’hui deposee 
dans les banques de donnees et elle est accessible pour tous par 
Internet. Un travail intense d’ annotation destine a comprendre comment 
fonctionnent les instructions contenues dans la sequence a ete entrepris. 
H s’annonce long et complexe car il depend en grande partie de 
connaissances qui restent encore a acquerir (ou a conquerir) sur la nature 
exacte de ces instructions et sur leur mode d’expression (voir chapitre 1 
« Qu’est-ce qu’un gene ? »). 
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Chaque personne humaine possede une sequence ADN unique, 
c’est-a-dire qui lui est propre. La sequence publiee par le consortium 
international correspond a la sequence combinee d’un petit nombre 
de donneurs anonymes et n’est done pas exactement la sequence 
exploitable pour chacun d’entre nous. L’un des projets d’avenir 
consistera a developper la puissance des techniques de sequen?age 
afin de pouvoir etablir pour chaque personne et a faible cout 1’exacte 
sequence de son ADN. On estime aujourd’hui qu’en moyenne 1’ ADN 
de deux humains pris au hasard differerait de 10 6 a 10 7 paires de bases 
dont une grande partie se presente sous la forme de SNP (Single 
Nucleotide Polymorphism). Ce polymorphisme moleculaire constitue 
l’une des bases « chimiques » des differences phenotypiques de tous 
ordres qui sont observables entre les personnes (voir chapitre 5.6). 

Vers la sequence pour tous 

Sera-t-il possible d’atteindre cet objectif dans un delai de temps 
raisonnable et a quel cout ? Le sequen^age du genome humain a coute 
pres de 3 milliards de dollars et a mobilise, durant pres de 1 1 ans, plus 
de 1 000 chercheurs du monde entier. Aux technologies de type 
« Sanger » (decrites au chapitre 6 du Mini-manuel Biologie Molecu- 
laire) se sont substitutes des technologies de plus en plus sophisti- 
quees et de plus en plus miniaturisees de sorte qu’ aujourd’hui il 
devient possible de realiser le resequen^age d’un genome complet en 
a peine quelques jours, bientot en quelques heures. Le principe de ces 
technologies a haut debit consiste a amplifier de courtes sequences de 
quelques dizaines de bases dans des volumes reactionnels extreme- 
ment reduits afin de generer des millions de tres courtes sequences 
d’ADN amplifiees qui sont ensuite sequencees individuellement. Ces 
courtes sequences sont ensuite reordonnees grace a des outils bio- 
informatiques de plus en plus performants qui les comparent a une 
sequence de reference. 

Le cout de ce resequence evolue egalement de maniere vertigi- 
neuse : des octobre 2006, la fondation americaine X Prize Foundation 
a annonce un prix de 1 0 millions de dollars pour la premiere entre- 
prise capable de sequencer un genome complet pour moins de 
1 000 $ ! Cet objectif est pratiquement atteint et certaines societes de 
biotechnologies annoncent deja avoir trouve des solutions pour 
reduire les couts de resequence & moins de 100 $. 

Ces nouvelles technologies de resequenc e ouvrent des perspec- 
tives revolutionnaires en matiere de recherche ( Tableau 3.4). II devient 
par exemple possible de connaitre precisement les alterations du 
genome d’une seule cellule cancereuse, d’ analyser simultanement les 
genes exprimes par l’ensemble des microorganismes d’un milieu donne 
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Tableau 3.4 Exemples duplications des technologies 



de s£quencage A haut-dEbit. 

Application 

Exemple 

Resequence complet 
de genome 

Recherche de polymorphismes a I'echelle du genome entre 
2 individus, recherche de nouvelles mutations, analyse fine 
de genes. 

Sequence de novo 

Alignement de sequences issues des technologies de 
sequence sans utiliser de genome de reference. Cette 
approche reste encore problematique, notamment a cause 
du grand nombre de sequences repetees mais a ete utilisee 
avec succes pour sequencer certains genomes bacteriens. 

II s'agit d'un enjeu majeur pour les prochaines annees. 

Resequence de 

regions ciblees 

Identification de nouveaux polymorphismes 
ou de mutations causales. 

Metagenomique 

Identification d'une flore bacterienne ou virale au sein 
d'une niche environnementale particuliere ;analyse globale 
des voies metaboliques et de I'expression des genes d'une 
population microbienne particuliere (ex :analyse du micro- 
biome). 

Sequence 

du transcriptome 

Analyse de I'expression des genes a I'echelle du genome, 
identification de transcrits rares. 

Sequence des petits 
ARNs 

Identification par sequence de petits ARN de type micro 
ARN et ARN non codants (ARN transcrit mais non traduit en 
proteines). 

Sequence apres 

immunoprecipitation de 
la chromatine (ChiP-Seq) 

Cartographie, a I'echelle du genome, des sites d'interaction 
entre I'ADN et les proteines regulant I'expression des genes. 

Code-barre moleculaire 

Sequence simultanes de plusieurs individus, chaque 
echantillon multiplexe etant repere par une sequence 
d'ADN unique constituant un code-barre moleculaire. 

Sequence 

de genomes anciens 

Reconstitution et analyse de genomes anciens d'especes 
disparues a partir d'ADN nudeaire, meme degrade (ex : 
genome du Mammouth, Homme de Neandertal). 


Pour les techniques, notamment le sequence de I'ARN (RNA-seq et Ribo-seq) voir le 
chapitre 6 du Mini-manuel de Biologie moleculaire. 
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(cette approche est appelee « metagenomique ») ou encore d’ amplifier 
et de resequencer specifiquement des sequences genomiques ciblees de 
plusieurs megabases. 

En peu de temps, la democratisation des technologies de sequen- 
<^age a haut-debit, rendue possible par une reduction tres importante 
des couts de sequen^age, a foumi a de nombreux champs d’ investi- 
gation, de nouveaux outils d’ analyse particulierement puissants, agissant 
comme un accelerateur de recherches. 

Une carte d'identite genetique 

Avec la baisse du cout du decryptage d’un genome, de plus en plus de 
genomes entierement sequences seront disponibles pour les cher- 
cheurs. Les retombees attendues sont considerables, notamment dans 
le domaine de la sante humaine. 

II est probable qu’a l’avenir, chacun disposera pour son propre 
genome de l’information genetique qu’il contient. Un individu pourra 
ainsi connaitre ses predispositions a developper certains types de 
cancer, ou encore recevoir un traitement personnalise de sa maladie 
en fonction de ses propres caracteristiques genetiques : c’est l’ere 
de la « genomique personnelle ». 

La recherche de caracteristiques moleculaires permettant de 
determiner si un individu est porteur d’une mutation responsable 
d’une maladie genetique demeure depuis longtemps l’objectif de 
nombreuses equipes de recherche. On trouvera ci-apres (Fig. 3.13 et 
3.14) deux exemples simples d’ utilisation des sequences repetees de 
type microsatellites permettant de reperer des mutations genetiques. 

Avec l’arrivee des technologies de genotypage a haut debit et celle 
des outils de sequen^ages a haut debit, des societes se sont speciali- 
sees dans le depistage de la susceptibilite a certaines maladies geneti- 
ques en exploitant la variabilite du genome. Ainsi, il est d’ores et deja 
possible, contre quelques centaines de dollars et un prelevement de 
salive, de connaitre le risque (relatif) de developper des maladies 
comme la maladie d’ Alzheimer, l’asthme, le cancer du sein, de la 
prostate ou du colon, la maladie de Crohn, V intolerance au lactose, la 
sclerose en plaque, l’infarctus du myocarde, l’obesite, le psoriasis, la 
polyarthrite rhumatoi'de ou encore les diabetes type 1 et type 2 ! 

Si dans certains cas medicaux, par exemple lorsqu’une atteinte 
familiale est suspectee, ce genre de service peut s’averer particuliere- 
ment interessant, il convient de rester prudent face aux derives ethi- 
ques qui peuvent accompagner ce genre de services. En effet, sans 
compter 1’ effet catastrophique que pourrait avoir ce genre de revela- 
tions sans accompagnement medical et psychologique, il est impor- 
tant que ces informations restent personnelles et ne puissent etre 
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transmises a des tiers ou etre utilisees commercialement... On 
imagine aisement 1’interet de certains assureurs a disposer d’ informa- 
tions sur les risques cardio-vasculaires d’un client venant souscrire un 
credit... 


■ i i iiiiimr 

* i 


(GT) 


24 


(GT) 


23 


(GT) 


18 


(GT) 


20 


Amorce A 


Amorce B 


Allele 1 (A1) 
Allele 2 (A2) 
Allele 3 (A3) 
Allele 4 (A4) 


A1 A2 A3 A4 pb 


88 

86 

80 

76 


Gel de polyacrylamide 

Figure 3.13 Analyse du polymorphisme d'un microsatellite. 

Le microsatellite (courte sequence d'ADN repete) est ici constitue d'une repetition 
variable (de 18 a 24) de dinucleotides GT (CA sur le brin complementaire). Dans les 
regions flanquantes du microsatellite, des amorces PCR ont ete choisies pour realiser 
un test d'amplification. Le schema represente 4 variants en longueur (taille), qui sont 
autant d'alleles differents du microsatellite. Ils sont identifies par leur distance de 
migration en gel de polyacrylamide. Pour qu'un locus microsatellite soit inf ormatif, son 
polymorphisme ne doit pas etre inferieur a 1 2 repetitions du motif nudeotidique. A un 
locus donne, un individu portera pour chaque paire de chromosomes homologues, 
I'un ou I'autre des variants du microsatellite. Dans une population, a un locus donne et 
pour un microsatellite, de nombreux variants sont generalement observes. Des centaines 
de loci polymorphes sont presents tout au long du genome de chaque individu. Par un 
choix raisonne de microsatellites et d'amorces PCR pour leur identification apres 
amplification et separation electrophoretique, des empreintes genetiques specifiques 
de chaque individu de I'espece peuventetre obtenues.C'est le principe du code-barre 
genetique utilise notamment par la police scientifique. 
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Analyse de I'ADN des membres de cette famille par PCR 
et electrophorese en gel de polyacryamide 

Figure 3.14 Diagnostic prenatal base sur ('utilisation du polymorphisme d'un 
microsatellite. 

Le microsatellite est situe dans la region promotrice du gene codant la dystrophine, 
une proteine importante dans la formation des muscles squelettiques. A la suite d'une 
reaction PCR et d'une analyse en gel de polyacrylamide, on observe chez un foetus en 
cours de gestation, la presence d'un amplifiat de 1 02 pb revelant un haplotype identique 
a celui de son onde myopathe (atteint de la maladie de Duchenne). Le risque que le 
sujet developpe a la naissance cette maladie tres invalidante est done eleve. 
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POINTS CLEFS 


> L'ADN est un acide nucleique bicatenaire constitue de deux chaines poly- 
nucleotidiques antiparalleles associees par des liaisons hydrogene entre 
les bases puriques et pyrimidiques qui les composent. 

> L'appariement specifique des bases A:T et G:C fait que dans I'ADN la quan- 
tity des purines (A + C) est egale a celle des pyrimidines (T + G) 

> L'orientation d'un brin d'ADN est definie par les groupements chimiques 
5'-phosphate et 3'-OH portes par les carbones 5'et 3' des desoxyriboses 
extremes 

> L'appariement complementaire des bases permet au geneticien de deter- 
miner la sequence nucleotidique d'un brin d'ADN a partir de celle du brin 
ADN complementaire ou de son transcrit ARN 
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> Dans les cellules d'eucaryotes, I'ADN s'enroule autour d'un noyau d'octa- 
meres d'histones pour former un nucleosome, premier stade d'empaque- 
tage de I'ADN pour constituer la chromatine 

> Les proteines de liaison a I'ADN peuvent interagir avec les groupements 
chimiques exposes tout particulierement par le grand sillon de I'ADN. Ces 
proteines contribuenta la regulation de I'expression des genes. 

> Des acides amines des queues d'histones peuvent etre modifiees par ace- 
tylation (lysine), methylation (lysine, arginine) et phosporylation (serine). 
Ces modifications constituent le « code histones » et contribuent a la plas- 
ticite de la chromatine. 

> La duplication des chromosomes s'effectue lors de la phase S du cycle cel- 
lulaire et leur segregation au cours de la phase M ou mitose. 

> Le genome fait reference a la sequence d'ADN correspondant a un jeu 
haploide de chromosomes, soit n chromosomes. Le terme genome s'appli- 
que a I'ensemble des genomes d'un organisme: ADN du noyau (genome 
nucleaire),des mitochondries (genome mitochondrial) et ADN deschloro- 
plastes chez les vegetaux (genome chloroplastique) 

> Le sequence d'un genome consiste a determiner I'ordre de I'agence- 
ment lineaire des nucleotides qui constituent un brin d'ADN ou un ARN 
chez certains virus. 

> La connaissance de la sequence de I'ADN humain (3,2 milliards de paires 
de bases) apporte des donnees utiles dans la prediction, le diagnostic et le 
traitement de maladies. 


QCM - QROC 

3.1 Valider ou non les affirmations suivantes. 

a) Les appariements entre les bases A, T, G, et C de I’ADN s’operent 
de fagon aleatoire. 

b) II y a autant de bases T et C dans I’ADN que de bases A et G. 

c) La synthese de I’ADN s’effectue dans la cellule grace a des ribo- 
nucleotides precurseurs. 

d) L’ARN peut former des structures en double helice. 

e) Les molecules d’ARN d’une cellule sont en majorite codantes. 

f) L’ histone HI est la principale proteine du nucleosome. 

3.2 Les liaisons phosphodiesters des polynucleotides reunissent : 

a) des bases puriques et pyrimidiques ; 

b) des pentoses ; 

c) des nucleosides monophosphates ; 

d) des nucleosides triphosphates 


Dunod - Toute reproduction non autorisee est un delit. 


Reponses 


87 


3.3 L’adenine constitutive de 1’ADN de deux especes bacteriennes 
est estimee respectivement a 30 % et 1 6 % de la totalite des bases. 
Quelles sont les proportions relatives des bases G, C, T, et A de ces 
deux echantillons ? L’une de ces bacteries a ete isolee a proximite 
d’un geyser d’eau chaude proche de 70 °C. Des deux ADN analyses, 
lequel provient de cette bacterie ? Expliquer. 

3.4 Le genome humain haploi'de (3,2 x 10’ paires de bases environ) 
represente 1’ information contenue dans 1000 manuels de 500 pages 
chacun. Son support est une molecule d’ADN d’environ 1 m. Combien 
un manuel et une page du manuel representent-ils de paires de bases 
et de longueur d’ADN ? 

3.5 Sachant qu’il y a chez 1’homme 23 paires de chromosomes, 
qu’elle est la distance moyenne en kilobases separant deux origines 
de replication ? 

V 

3.6 A combien de nucleosomes un ADN humain peut-il en theorie 
etre associe, sachant que dans sa forme compacte un nucleosome 
represente un ADN de 160 paires de bases et que la distance separant 
deux nucleosomes est en moyenne de 40 paires de bases ? Combien 
de molecules d’ histone HI et d’hi stone H2 seront-elles necessaires ? 

3.7 On estime que le genome humain contient 25 000 genes. En suppo- 
sant arbitrairement que les genes sont disposes de fa 9 on reguliere et 
que la region codante moyenne d’un gene est de 2 kpb, quelle est la 
distance separant en moyenne le centre de deux genes ? Quelle est la 
proportion du genome qui code les proteines ? La nature des regions 

-d non codantes ? 

O 

C 

=3 

Q 

REPONSES 

r\j 
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3.1 a) non ; les appariements s’etablissent obligatoirement entre les 
bases A et T d’une part et G et C d’autre part, b) oui ; c) non ; grace a 
des desoxyribonucleotides precurseurs ; d) oui, de fa^on partielle par 
repliement du polynucleotide sur lui-meme et a condition que la 
complementarity des bases A-U et G-C soit pour l’essentiel respectee ; 
e) non, seuls les ARN messagers qui representent 20 % environ des ARN 
cellulaires sont codants ; f) non, ce sont les histones de 1’octamere 
H2A, H2B, H3 et H4 qui forment le nucleosome. 

3.2 c) 

3.3 L’un des ADN contient 30 % d’ adenine, 30 % de thymine, 20 % de 
guanine et 20 % de cytosine. L’ autre ADN contient 16 % d’ adenine, 
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16 % de thymine, 34 % de guanine et 34 % de cytosine. L’ ADN ayant 
la plus forte teneur en G + C (68 %) provient probablement de la 
bacterie vivant a proximite de la resurgence d’eau chaude. En effet, le 
nombre de liaisons hydrogenes de la double helice le rend en effet 
plus stable vis-a-vis de la chaleur. 

3.4 Un manuel represente 3,2.10 6 pb et une longueur de 1 mm ; une 
page du manuel represente 6 400 paires de bases et une longueur de 
2 pm. 

3.5 En moyenne, un chromosome contient 3,2 x 1 0 9 /23 soit 1 ,39 x 1 0 8 
paires de bases. Si Ton considere environ 3 000 origines de replication 
par chromosome, la distance separant en moyenne deux origines de 
replication sera de 46 300 paires de bases. 

3.6 On considere qu’a chaque ADN nucleosomal est associe un ADN 
de liaison, soit 160 + 40 = 200 paires de bases. Chaque ensemble sera 
done represente 3,2 x 10 9 /200, soit 1,6 x 10 s fois. II y aura done 
160 000 000 de nucleosomes ; il y aura un nombre identique d’ hi stones 
HI et quatre fois plus d’ histone H2 puisque cette derniere existe sous 
deux formes (H2A et H2B) et que chacune est representee deux fois 
dans 1’octamere d’ histones. 

3.7 La distance moyenne separant le centre de deux genes est de 
3200000 kpb, divisee par 25 000, soit 1 28 kpb. La proportion du genome 
humain qui code des proteines est de 1,56% environ. Les autres 
sequences comprennent diverses regions intergeniques, repetees et 
non repetees, des transposons, des pseudogenes, des regions regulatrices, 
des introns, etc. 
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4.1 Genetique bacterienne 

4.2 Genetique des bacteriophages 

4.3 Test de complementation ou test d'allelisme fonctionnel 

4.4 Test d'allelisme structural 

4.5 Genetique de la levure 

4.6 Micro-organismes et genie genetique 



Comprendre le transfert d'ADN chez les bacteries 
Aborder les mecanismes de transduction 
Comprendre I'interet des tests de complementation 
Integrer les applications de la genetique des micro-organismes 


Des qu’il fut clair que des relations directes existaient entre le materiel 
hereditaire et les caracteristiques fonctionnelles d’une cellule ou d’un 
organisme, les micro-organismes s’imposerent comme des outils de 
choix pour explorer en profondeur la nature des genes. Pourtant, on 
ne peut pas dire a priori que, n’etant pas visibles a l’oeil nu, les micro- 
organismes possedent des caracteristiques facilement reconnaissables. 
Le fait d’ avoir assez rapidement caracterise leurs defauts metaboliques, 
isole les souches mutantes, etabli une relation entre des variants bio- 
chimiques et les mutations geniques, en un mot, engage une veritable 
demarche d’ etude genetique fondee sur les relations entre genes et 
fonctions, a largement contribue a leur succes. 

Etant donne qu’il s’agitd’organismes haploides, l’analyse genetique 
ne depend pas du fait qu’une mutation soit dominante ou recessive 
puisqu’un seul allele du gene etudie est present. II ne peut done pas 
etre masque dans son expression par un autre allele, comme e’est 
frequemment le cas pour les organismes diploides. De plus, les micro- 
organismes, tout particulierement les bacteries, peuvent produire une 
nouvelle generation de cellules en moyenne toutes les heures, ce qui, 
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pour le geneticien qui etudie la transmission des caracteres et des genes 
au cours des generations successives, constitue un avantage considerable. 

Pour toutes ces raisons et d’autres qui seront abordees au fil de ce 
chapitre, la genetique des micro-organismes a contribue de fagon deci- 
sive a fonder les concepts majeurs de la genetique. Elle a su realiser 
avant toute autre, la synthese entre l’approche phenomenologique (les 
phenotypes) et l’approche moleculaire (les genes et 1’ ADN). 

4.1 GENETIQUE BACTERIENNE 

Les bacteries appartiennent a une classe d’organismes appeles 
procaryotes qui inclut egalement les algues bleues ou cyanobacte- 
ries. Les procaryotes ne possedent pas de noyau. Leurs genes, consti- 
tues d’ADN, sont regroupes essentiellement sur un seul chromosome 
circulate. Des structures de plus petite taille, les plasmides, portent des 
genes, tels les genes de resistance a des agents chimiques, qui foumis- 
sent a la cellule la possibility de vivre et se multiplier dans un environ- 
nement defavorable. 

Organismes modeles dont le plus connu est la bacterie Escherichia 
coli ( E . coli ), ils se divisent rapidement et se cultivent sur des milieux 
liquides ou solides contenant les elements nutritifs de base (milieu 
minimal : sels inorganiques et une source de carbone). Cultivees sur 
milieu solide en boite de Petri, les bacteries sont immobilisees et 
restent regroupees. A partir de 10 7 cellules, la masse de cellules cons- 
titue une colonie, visible a l’ceil nu. Toutes les cellules d’une colonie 
isolee sur une boite sont issues d’une seule cellule, elles ont done 
toutes le meme materiel genetique et constituent un clone. 

Mutants bacteriens 

En traitant les bacteries avec des agents mutagenes, on peut obtenir de 
tres nombreuses mutations qui empechent la cellule de se multiplier 
dans un milieu minimal (voir Fig. 2.1) . Elle ne pourra croitre que si 
Ton ajoute a ce milieu tel ou tel metabolite dont la synthese n’est plus 
assuree dans la cellule mutante. Ainsi, un grand nombre de mutations 
touchant la synthese des metabolites essentiels pour la croissance 
bacterienne ont ete identifiees, chacune d’ entre elles correspondant a 
l’une des enzymes mises en jeu dans les etapes de biosynthese des 
diverses molecules biologiques. 

Pour une espece bacterienne donnee, la souche qui a perdu la capacite 
de synthetiser un metabolite essentiel (un acide amine par exemple) 
est dite auxotrophe (pour cet acide amine). A 1’ inverse, la souche de 
type sauvage qui ne presente pas cette exigence nutritionnelle sera 
dite prototrophe. Certains mutants ne sont plus capables d’utiliser 
par exemple un ose particulier comme source de carbone, on parle alors 


Dunod - Toute reproduction non autorisee est un delit. 


4.1 • Genetique bacterienne 


91 


de mutants cataboliques. Certaines substances chimiques, comme 
les antibiotiques, peuvent tuer les bacteries mais certaines d’entre elles, 
appeles mutants resistants, peuvent se diviser meme en presence de 
l’antibiotique et fonder des colonies. Tous ces divers types de mutants 
( Tableau 4.1) fournissent des marqueurs genetiques pour suivre 
1’evolution des genomes lors d’ experiences. 


Tableau 4.1 Symboles utilises en genetique bacterienne. 


Symboles 

Phenotypes associes 

leu~ 

Auxotrophe pour la leucine qui doit etre presente en plus du milieu minimum 

leu + 

Prototrophe pour la leucine, alors inutile dans le milieu minimum 

loc~ 

Incapable d'utiliser le lactose comme source de carbone 

lac + 

Utilise le lactose comme source de carbone 

amp s 

Sensibilite a un antibiotique, ici I'ampicilline 

amp 1 

Resistance a un antibiotique, I'ampicilline 


Conjugaison bacterienne 

En 1946, Joshua Lederberg et Edward Tatum, par une experience a la 
fois simple et elegante, exploitent les exigences d’E. coli en certains 
nutriments pour demontrer l’existence de la recombinaison genetique. 
Ils utilisent deux souches A et B presentant des exigences nutritionnelles 
differentes. 

C 

La souche A est auxotrophe pour la methionine et la biotine et 
prototrophe pour la leucine et la threonine ; son phenotype est done : 
met - , bio - , leu + , thr + . La souche B est auxotrophe pour la threonine et 
la leucine et prototrophe pour la methionine et la biotine ; d’ou son 
phenotype : met + , bio + , leu - , thr. Si des cultures de bacteries A et B 
en melange sont etalees sur des boites contenant un milieu minimum 
sans supplement nutritionnel, quelques colonies apparaissent apres 
48 h. Seules des bacteries prototrophes (met + , bio + , leu + , thr + ) sont 
capables de se developper sur un tel milieu. Par contre, aucune colonie 
n’est visible sur les boites temoins ensemencees avec des bacteries A 
ou B (Fig. 4.1). Pour s’ assurer que les souches ne secretaient pas de 
substances qui auraient ete absorbees et utiliser par les autres cellules 
pour leur proliferation, Bernard Davis construisit un tube en U dont 
les deux bras sont separes par un filtre qui ne peut laisser passer que 
les molecules dissoutes dans le milieu. En introduisant la souche A 
dans un bras, et la souche B dans 1’ autre, et apres plusieurs heures 
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d’ incubation, Davis testa les cellules de chaque bras du tube et constata 
1’ absence de cellules de phenotype met + , bio + , leu + , thr + . II en conclut 
qu’une union physique des bacteries est necessaire pour qu’un transfert 
d’ information genetique entre les deux souches ait eu lieu. Cette union 
physique, visible en microscopie electronique, est appelee conjugaison. 


Souche A 

Met - Bio - Leu + Thr* 



Souche B 

Met + Bio+ Leu - Thr - 



Aucune colonie 

Melange des 
souches A et B 

Aucune colonie 

ne pousse 


ne pousse 


Incubation 

Etalement 


1 



Milieu minimum 


Apparition de quelques 
colonies de phenotype 
(Met + Bio + Leu + Thr + ) 


Figure 4.1 Mise en evidence du transfert de materiel genetique entre bacteries. 

Les souches A et B ne peuvent pas se diviser sur un milieu minimal. En effet la souche A 
doit trouver dans le milieu la methionine et la biotine et la souche B, la leucine et la 
threonine. Or, le milieu minimal ne les contient pas.Le melange des souches, qui favorise 
le transfert de materiel genetique, conduit a I'apparition de colonies recombinantes 
capables de synthetiser elles-memes les quatre metabolites a partir des constituants 
du milieu minimal. 


Le facteur sexuel 

L’experience decrite ci-dessus suggere l’existence d’une sexualite chez 
les bacteries. En effet, il existe des cellules avec un role de donneur 
et des cellules ayant le role de receveur. Cependant, les genomes de 
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ces bacteries ne fusionnent jamais en entier pour constituer un nouveau 
descendant comme chez les organismes superieurs. Le transfert de 
1’ information genetique est unidirectionnel et est assure par un facteur 
de fertilite ou facteur F. C’est un ADN circulaire autoreplicatif 
appele episome dont heritent les cellules filles independamment du 
chromosome bacterien (Fig. 4.2). Les bacteries qui le possedent sont 
dites F + assurant le role de donneur, et celles qui ne le possedent pas 
sont dites F~ et receveuse. Le facteur F comporte, entre autre, toute 
reformation genetique necessaire pour son transfert d’une bacterie 
F + vers une bacterie F~ Lors du transfert, un contact physique (pont 
cytoplasmique) s’etablit entre les deux bacteries, grace notamment a 
Faction de pili sexuels codes par le facteur F et qui se trouvent a la 
surf ace des bacteries F + . 
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Figure 4.2 Quelques proprietes de I'episome ou facteur F. 

En a, present dans les bacteries F + , le facteur F se replique de fa^on autonome et il est 
herite par toutes les cellules filles ; en b, lors du croisement d'une souche F + avec une 
souche F - , toutes les bacteries deviennent F + ;et en c, formation d'une bacterie Hfr. 


Quand on croise des bacteries F + et des bacteries F - toutes les 
bacteries deviennent F + . Dans les bacteries donneuses, une copie 
simple-brin de l’ADN F est synthetisee selon un mecanisme particulier 
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appele replication en cercle roulant. Un brin de 1’ ADN F est transfere 
dans le cytoplasme de la cellule receptrice ou il va servir de matrice 
pour la synthese du second brin. L’autre brin d’ADN reste dans la 
cellule donneuse lui permettra de la meme fagon de reconstituer par 
synthese du brin complementaire un facteur F fonctionnel. Dans ce 
type de croisement, aucun fragment du chromosome bacterien de la 
souche F + n’est transfere vers la souche F _ , on assiste seulement au 
transfert entier du facteur F selon des modalites respectant le principe de 
replication semi-conservative (Fig. 4.2). La conjugaison bacterienne 
permet le transfert de l’ADN (facteur F dans le cas present), d’une 
bacterie a une autre. 

Les souches Hfr 

Le croisement d’une souche F + de type sauvage, c’est-a-dire non 
mutee avec une souche F _ auxotrophe pour certains metabolites et 
resistante a un antibiotique puis 1’etalement du melange sur le milieu 
de selection (milieu minimum contenant l’antibiotique) aboutissent au 
developpement de quelques rares colonies recombinantes temoignant 
du transfert de materiel genetique entre les deux souches bacteriennes. 
Les colonies recombinantes proviennent de bacteries F _ (auxotrophes) 
ayant regu par conjugaison les genes necessaires pour restaurer leur 
capacite a croitre sur le milieu minimum, c’est-a-dire presentant le 
phenotype sauvage. Cette conjugaison exceptionnelle ou quelques rares 
bacteries F + transferent du materiel genetique a partir de leur chromo- 
some principal est due a l’integration du facteur F dans le chromosome 
principal (Fig. 4.2). II est possible d’isoler les quelques cellules qui 
ont integre le facteur F dans leur chromosome. 

Si 1’ experience de croisement est alors repetee avec la nouvelle 
population constitute de cellules ayant integre le facteur F dans 
leur chromosome, on obtient 1000 fois plus de recombinants. Ces 
souches sont appelees pour cette raison Hfr pour Haute frequence de 
recombinaison. 

Grace a 1’ integration du facteur F dans le chromosome principal, 
ces souches peuvent transferer efficacement aux souches F _ une partie 
de leur genome. De ce fait, la bacterie receptrice peut devenir, a cause 
du fragment de chromosome regu, homologue de son propre chromo- 
some, une cellule partiellement diploide. Cette information genetique 
transferee s’ integre ensuite dans le chromosome de la bacterie F~ par 
un double crossing-over (Fig. 4.3), ce qui permet d’obtenir des cellules 
et des colonies recombinantes stables. Les cellules F - qui portent un 
allele du donneur ont done participe a la conjugaison et sont appelees 
exconjugants. 
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Integration de a + par double 
crossing-over 


Degradation du fragment 
d’ADN lineaire 



Bacteries F (a + Str r ) 



Milieu + streptomycine 


Selection de recombinants 
pour le caractere a + 


Figure 4.3 Principe de ('integration de marqueurs genetiques dans le chromo- 
some bacterien et selection des cellules recombinantes. 

La bacterie F _ estauxotrophe pour un acide amine (a-) et resistante a la streptomycine 
(Str r ). La bacterie Hfr est prototrophe (a + ) et sensible (Str s ). Le transfert oriente vers la 
bacterie F~ de la region chromosomique (a + ) contenant le(s) gene(s) permettant la 
synthese de I'acide amine, suivi d'un double crossing-over, entraine la creation d'une 
souche recombinante (a + , Str r ) qui peut croitre et former des colonies sur un milieu 
minimal contenant de la streptomycine, milieu qui n'autorise ni la croissance de la souche 
Hfr (Str s ), ni celle de la souche F~ (a - ). 


H existe un grand nombre de souches de type Hfr puisque 1’ integration 
du facteur F s’effectue grace a un mecanisme de crossing-over en de 
nombreux sites du chromosome de la bacterie (Fig. 4.4). Les regions 
d’appariements, identiques sur le plasmide et le chromosome, provien- 
nent d’elements mobiles, appeles sequences d’insertion. Toutes ces 
souches Hfr transferent done a des souches F _ toujours la partie de 
leur chromosome qui est immediatement en amont de l’origine de trans- 
fert. En effet, l’origine et la direction du transfert sont determinees par 
la meme extremite du facteur F, appelee origine de transfert liberee 
par clivage. Lors de la conjugaison d’une bacterie Hfr avec une 
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bacterie F - , 1’ information genetique du facteur F sera done toujours 
transferee en dernier lieu apres que tout le chromosome de la souche 
Hfr soit transfere, e’est-a-dire tres rarement. Le processus est fragile 
et la rupture du pont cytoplasmique et de l’ADN en cours de transfert 
se produit frequemment. Par consequent, la souche F _ n’est quasiment 
jamais convertie en F + ou en Hfr a la suite de son croisement avec la 
souche Hfr. 

a) Origine de b) 

transfert (T) 



C) 

i Gen^ ^ i |M ^ ^ Gene 2 ^ 

Gene Gene D Gene B 

de la fertilite 

Figure 4.4 Integration du facteur F dans le chromosome bacterien et transfert 
oriente de marqueurs genetiques. 

En a, le facteur F s'integre dans le chromosome bacterien par crossing-over en mettant 
en jeu des homologies de sequences entre les deux molecules d'ADN. En b, le facteur 
F integre dans le chromosome d'une bacterie devenue de ce fait Hfr ; en c, dans le cas 
present I'endroit ou s'integre le facteur F permet le transfert a partirde I'origineT des 
marqueurs dans I'ordre, A, B, C et D (1 et 2 sont des marqueurs symboliques pour 
orienter I'ADN insere). 


Bien que le facteur F s’integre de fagon stable dans le chromosome 
de la souche Hfr, parfois il quitte le chromosome par inversion exacte 
du processus de recombinaison qui lui a permis son insertion. Parfois, 
sa sortie n’est pas rigoureusement identique a l’insertion, le plasmide 
emportant avec lui une partie du chromosome bacterien. Le nouveau 
plasmide qui en resulte s’appelle plasmide F’. Les facteurs F’ peuvent 


Dunod - Toute reproduction non autorisee est un delit. 


4.1 • Genetiquebacterienne 


97 


porter plusieurs genes chromosomiques et sont nommes d’apres les 
genes supplementaires qu’ils portent. 

Cartography par conjugaison 

La figure 4.5 decrit le principe d’une experience de conjugaison inter- 
rompue chez les bacteries. Au bout de 5 min de conjugaison entre la 
souche Hfr et la souche F', aucun recombinant ne sera obtenu pour les 
marqueurs genetiques testes quel que soit le crible de selection utilise. 
Apres 1 5 min de conjugaison, on peut caracteriser des recombinants 
de la souche F _ pour a + , b + . Le crible de selection des recombinants 
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Figure 4.5 En a : Principe d'une experience de conjugaison interrompue chez les 
bacteries. On a represente le passage du chromosome de la bacterie Hfr dans la 
bacterie F - et la rupture du pont cytoplasmique et du chromosome en fonction 
du temps. L'arret de la conjugaison s'effectue par agitation. Line partie du fragment 
d'ADN ayant penetre dans la bacterie receveuse peut s'integrer par recombinaison 
homologue dans le chromosome. En b, chromosomes de deux souches Hfr. L'origine 
de transfert est representee par un triangle, le terminus de transf ert par un rectangle 
noir.La position et I'orientation de l'origine de transfert imposent le sens du trans- 
fert. Pour la souche 1 c'est le gene pur qui sera transfere en premier alors que pour 
la souche 2 c'est le gene his. 
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est tres important : si au bout de 15 min de conjugaison, on selec- 
tionne les recombinants uniquement pour le caractere a + parmi tous 
les recombinants a + obtenus, certains seront a + b + mais on n’aura 
jamais de recombinant pour b + uniquement. Autrement dit, le 
premier crossing-over dans ces conditions a eu lieu obligatoirement 
du cote de l’origine de transfert et le deuxieme soit entre a + et b + 
(recombinant a + ) soit en dehors de l’intervalle separant a + de b + 
(recombinant a + b + ). II ne faut pas oublier que deux crossing-over 
sont necessaires pour l’echange d’ information genetique entre un 
fragment lineaire d’ ADN (fragment transfere) et un ADN circulaire 
(chromosome bacterien). 

Cette experience type peut etre exploitee pour determiner la liaison 
entre les genes. Pour qu’un exconjugant integre dans son chromosome 
les genes du donneur de maniere definitive, le fragment chromoso- 
mique du donneur doit recombiner avec le chromosome du receveur. 
II faut noter que les unites sont des minutes et non des frequences de 
recombinaison. II s’avere neanmoins possible d’utiliser la frequence 
de recombinaison pour la cartographic du chromosome bacterien. La 
recombinaison se produit ici entre un genome complet issu de F _ , 
appele l’endogenote, et celui incomplet, appele l’exogenote, issu du 
donneur Hfr. A ce stade la cellule possede deux copies d’un fragment 
d’ADN, c’est un diploi'de partiel ou merozygote. Un seul crossing- 
over dans un merozygote ouvrirait le cercle et il n’y aurait pas de 
recombinant viable. Pour que le chromosome demeure circulaire, il 
faut obligatoirement un nombre pair de crossing-over. 

Pour determiner la liaison et obtenir des distances cartographiques 
significatives, il est necessaire d’etablir des conditions dans lesquelles 
tous les marqueurs ont une probability egale d’etre transmis, de sorte 
que les frequences de recombinaison ne dependent que de la distance 
entre les genes consideres. De ce fait, pour etudier la liaison genetique 
entre les marqueurs a + , b + , c + , d + , et e + par exemple, il faut selec- 
tionner les recombinants pour le dernier marqueur qui sera transfere, 
c’est-a-dire e + dans le cas present (Fig. 4.5). Pourquoi ? Parce que nous 
savons que chaque cellule qui a requ un fragment de chromosome 
portant le dernier marqueur a egalement regu les marqueurs anterieurs 
(a + , b + , c + et d + ). Nous pouvons alors calculer la distance entre 
marqueurs qui est egale au pourcentage de crossing-over dans les 
intervalles qui les separent. Pratiquement, cela revient a calculer parmi 
le nombre total de recombinants obtenus pour un marqueur determine 
le pourcentage de ceux qui font ete grace a un crossing-over entre ce 
marqueur et le marqueur voisin. 

En combinant V utilisation de diverses souches Hfr portant les memes 
marqueurs genetiques (locus d’auxotrophie pour tel ou tel acide amine 
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par exemple), on constate que l’ordre de transfert des marqueurs n’est 
pas conserve d’une souche a 1’autre, ce qui s’explique par la circularite 
du chromosome bacterien d’une part, l’origine et la direction du transfert 
d’autre part. En repetant l’experience avec une autre souche Hfr qui 
transfere le marqueur b + en premier, celui qui sera transfere le dernier 
ne sera plus e + mais a + . De plus, en jouant sur le temps de transfert, 
qui peut etre controle en provoquant la rupture du pont cytoplasmique 
et de l’ADN par une vigoureuse agitation, on a pu cartographier, 
c’est-a-dire determiner la position relative des loci d’auxotrophie, 
la resistance a des antibiotiques, a 1’infection phagique, en un mot, 
cartographier le chromosome bacterien. 

Les plasmides R 

La resistance multiple aux antibiotiques est certainement la propriete 
la plus alarmante des bacteries pathogenes, mise en evidence dans les 
annees 1950, avec des bacteries du genre Shigella responsables de la 
dysenterie. La bacterie a tres rapidement acquis une resistance a de 
nombreux antibiotiques (penicilline, tetracycline, streptomycine, etc.) 
couramment utilises pour enrayer la maladie. Ce phenotype de resis- 
tance multiple transmis sous la forme d’un groupe genetique unique, 
peut se transmettre non seulement a d’autres souches de Shigella mais 
egalement a des especes apparentees. Cette propriete, proche de la 
mobilite du facteur F chez E. coli, est tres favorable pour la bacterie 
pathogene car la resistance se propage tres rapidement a travers une 
population. Les vecteurs transportant les multiples resistances d’une 
cellule a une autre appartiennent a un groupe de plasmides, les plas- 
mides R qui sont transferes rapidement lors de conjugaisons cellulaires. 
Les premiers decouverts, les plasmides R de Shigella, font partie d’une 
grande serie de plasmides de meme type. Tous presents a l’etat plasmi- 
dique dans le cytoplasme des bacteries, ils portent de nombreux types 
differents de genes comme les genes de resistance aux metaux lourds 
(plasmide R6), de production de bacteriocines (plasmide Col El), de 
tumorigenicite dans les plantes (plasmide T1 chez Agrobacterium 
tumefaciens ). 

La transformation bacterienne 

Le mecanisme par lequel une bacterie absorbe de V ADN exogene a partir 
de son environnement et l’integre de fagon fonctionnelle dans son 
chromosome est appele transformation. Ce mecanisme de modification 
des proprietes genetiques par de 1’ ADN en solution fut decouvert chez 
Streptococcus pneumoniae en 1928 par Frederick Griffith et Oswald 
Avery. Par la suite, en 1944, Avery, Mac Leod et Mac Carty demontrerent 
que le principe transformant etait bien de 1’ ADN. 
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Competence genetique naturelle chez les bacteries 

Tout d’abord observee chez la bacterie Gram-positive, S. pneumoniae, 
la transformation se revela un processus naturel chez de nombreuses 
bacteries Gram-positives et Gram-negatives. La capacite qu’ont les 
bacteries a absorber naturellement des fragments d’ADN exogene en 
solution, processus norame competence naturelle, est genetiquement 
definie. En effet, les bacteries competentes, expriment des proteines 
specialises qui permettent aux cellules de capter puis d’integrer des 
fragments d’ADN presents occasionnellement dans leur environnement 
(Fig. 4.6). 



Formation d’un complexe 
proteique fixant I’ ADN 

Absorption de I’ADN issu 
d’une bacterie morte 


Degradation par une DNAse 
d’un des 2 brins de I’ADN 


Integration dans le chromosome 
bacterien 


Figure 4.6 Principe de la transformation bacterienne. Un fragment d'ADN libere 
par une bacterie morte est absorbe. Au niveau des proteines du complexe de 
fixation de I'ADN, et au cours de son entree un des brins de I'ADN est degrade, 
I'autre brin envahit I'ADN de la cellule receveuse. Celui-ci sera par la suite, apres 
synthese du brin complementaire, integre dans le chromosome bacterien. 


La fixation de I’ADN chez Neisseria gonorrheae et Haemophilus 
influenzae est selective dans la mesure ou le fragment incorpore doit 
contenir une sequence nucleotidique specifique. Chez H. influenzae, 
il doit contenir une sequence consensuelle de 29 pb avec un segment 
hautement conserve de 9 pb. Aujourd’hui, grace au sequen^age du 
genome de cet organisme, on sait que cette sequence est frequemment 
representee. Au total, 1 465 sequences de ce type ont ete identifies 
dans le genome de H. influenzae qui a une taille de 1 830 kpb. C’est 
une sorte de signature, d’identite, du genome de cet organisme. Pour 
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Streptococcus pneumoniae et Bacillus subtilis, l’absorption de l’ADN 
n’est pas selective. Aucune sequence specifique n’est requise pour trans- 
former ces deux bacteries. Cependant, chez les deux, le developpement 
de la competence est regule par une sorte de communication entre les 
cellules : avant de developper son etat de competence, une cellule doit 
recevoir un signal des autres cellules de la population. Un tel systeme 
permettrait aux cellules de ne developper un etat de competence qu’au 
voisinage d’ autres cellules de la meme espece et par consequent, de 
n’ absorber que de l’ADN propre a cette espece. 

La transformation artificielle 

Les mecanismes de transformation naturelle decrits ci-dessus mettent 
en jeu un grand nombre de proteines, et parfois une sequence d’ADN 
specifique. Au vu de la complexity de ce systeme de transformation 
naturelle, 1’ application de la technologie de 1’ ADN recombinant a ces 
micro-organismes reste relativement difficile. D’ autres bacteries comme 
E. coli, sont plus facilement transformables par de l’ADN exogene. 
L’etat de competence de ces bacteries peut etre accru en les traitant 
par des ions divalents comme le Ca 2+ . On parle dans ce cas de trans- 
formation artificielle. La transformation artificielle induite par Ca 2+ 
n’est efficace chez E. coli que lorsque l’ADN est ajoute sous une forme 
capable d’ autoreplication. Les ADN de plasmides et les chromosomes 
viraux intacts ont une grande efficacite de transformation, alors que 
les fragments lineaires d’ADN bacterien transforment tres faiblement 
les bacteries. 

Ainsi, la transformation bacterienne qui revela au monde que 1’ ADN 
est le support du materiel genetique, nous fournit aujourd’hui un moyen 
puissant pour l’etude des genes in vivo et in vitro. Le mecanisme de 
transformation des bacteries par des plasmides permet theoriquement 
d’introduire n’importe quel fragment d’ADN dans une cellule pour 
etudier les consequences de son expression. 

Cartographie du chromosome bacterien grace a la transformation 

Nous avons vu que la transformation des bacteries par 1’ ADN en solution 
permettait de transferer un caractere d’une bacterie a une autre. 

Considerons deux bacteries, l’une receptrice, l’autre donatrice, 
differentes par plusieurs caracteres : soit a, b, c, d, les genes gouvernant 
les caracteres distinctifs de la bacterie receptrice et A, B, C, D, ceux de 
la bacterie donatrice. Pour chacun des caracteres, on observe que la 
frequence d’ apparition des bacteries transformees portant un seul 
caractere nouveau est de l’ordre de 10 -2 . 

Les frequences des bacteries transformees simultanement pour deux 
caracteres (double transformation) sont en general egales au produit 
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des frequences de chacune des transformations simples (par exemple 
pour CD 10 -2 x 10 -2 = 10 -4 ). En revanche pour BC cette frequence 
est plus elevee 0,2 x 10 -2 . L’explication est que les genes B et C sont 
suffisamment proches sur le chromosome bacterien pour etre portes 
par un meme fragment de telle sorte que les doubles transformes BC 
resultent de la penetration dans la bacterie receptrice d’un unique 
fragment (genes lies). En appliquant cette technique, on a pu etablir la 
carte du chromosome de B. subtilis. 

4.2 GENETIQUE DES BACTERIOPHAGES 

Le cycle biologique des bacteriophages 

C’est par necessite biologique que les virus sont des parasites. Ils ne 
possedent pas la capacite de synthetiser leurs composants de fagon 
independante. Pour se reproduire, ils doivent introduire leur genome 
dans une cellule hote vivante. Tous les virus sont de petites particules 
formees d’une enveloppe protectrice riche en proteines qui facilite 
leur transport d’une cellule a 1’ autre. Leur materiel genetique est soit 
de l’ADN, soit de l’ARN mais jamais les deux en meme temps. 

Les bacteriophages (ou phages) sont des virus qui infectent les 
bacteries. Ils ont joue, et continuent de jouer, un role fondamental 
dans la genetique bacterienne et la genetique moleculaire en general. 
Pendant plus de trente ans (1940-1973), ils ont ete des outils precieux 
pour etudier les consequences de 1’ introduction d’un nouveau materiel 
genetique dans une cellule. Ainsi, les etudes menees sur les phages 
ont aide a la comprehension des structures et de 1’ expression des genes, 
1’ assemblage de structures biologiques complexes et le transfert de 
materiel genetique entre bacteries. 

Les phages les plus etudies sont ceux qui se multiplient chez E. coli 
ou des bacteries tres proches. On les a arbitrairement nommes T 1 , T2, 
T4, PI, FI, M13 ou X par exemple. Un phage infecte une bacterie en 
s’attachant a un recepteur specifique de la surface bacterienne. Une 
fois fixe, le phage injecte son materiel genetique dans le cytoplasme. 
Certains des genes du phage sont exprimes immediatement (genes 
precoces) apres l’injection de l’ADN dans la bacterie, en utilisant des 
enzymes presentes dans le cytoplasme de la bacterie. Ces genes 
precoces codent des enzymes necessaires a la replication de l’ADN 
phagique en un grand nombre de copies. Les genes tardifs commencent 
ensuite a s’ exprimer. Ce sont principalement des genes qui codent les 
proteines necessaires a la production de nouvelles capsides phagiques. 
Une fois les differents constituants phagiques assembles, la paroi 
bacterienne est detruite (on parle de lyse bacterienne), liberant un grand 
nombre de nouveaux phages dans le milieu environnant. Chacun d’ entre 
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eux est capable d’infecter une nouvelle bacterie, ce qui permet un 
nouveau cycle biologique du phage (Fig. 4.7). 



Proliferation des 
bacteries 


Figure 4.7 Cycle ly tique d'un bacteriophage (ah et cycle ly sogenique (b). 


La lysogenie 

Dans les annees 1920, on a observe que certaines souches bacteriennes 
apparaissaient resistantes a certains phages. Cependant, ces bacteries 
resistantes entrainaient la lyse d’autres bacteries lorsqu’on melangeait 
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les cultures. Ces bacteries resistantes sont dites lysogenes. Vers le milieu 
des annees 1940, Andre Lwoff montra qu’une bacterie lysogene est 
une bacterie qui contient un genome viral, insere en un point deter- 
mine de son propre chromosome. La presence de l’ADN du phage a 
l’etat integre dans le chromosome bacterien, on parle de prophage, 
protege la bacterie de 1’ infection par un autre phage (surinfection). Cette 
immunite reste stable et peut etre transmise aux cellules bacteriennes 
filles. Le prophage se duplique par consequent au meme titre que les 
autres regions du chromosome bacterien. Chez une petite fraction de 
cellules lysogenes, on peut assister a la production de phages infectieux. 
On parle de 1’ induction du prophage des bacteries lysogenes. Ce 
processus prive, evidemment, la cellule de son immunite, lyse la bacterie 
et libere les phages infectieux dans le milieu. Ces demiers peuvent 
infecter toute bacterie non lysogene presente dans le milieu de culture. 

Des etudes ulterieures montrerent que differents agents, tels que le 
rayonnement ultraviolet ou certains produits chimiques, pouvaient 
induire la lyse d’une fraction importante d’une population de bacteries 
lysogenes. 

Ainsi, on a pu classer les phages en deux categories : 

> les phages virulents : ils provoquent tou jours la lyse des bacteries 
et ne peuvent exister a l’etat de prophage ; 

> les phages temperes : ils suivent frequemment un cycle lysogenique 
et s’installent dans la bacterie hote sous forme de prophage. Dans 
certaines conditions, ils peuvent suivre un cycle lytique, lorsque le 
prophage est induit. 

La transduction 

En 1 95 1 , J. Lederberg et N. Zinder, Iravaillant sur la bacterie Salmonella, 
montrerent que des caracteres pouvaient etre transmis de fagon passive 
d’une bacterie a une autre par 1’ intermediate d’un bacteriophage. Ils 
appelerent ce phenomene la transduction. 

Une experience typique de transduction consiste a infecter une 
bacterie leu + par un phage transducteur specifique de cette bacterie. 
Le developpement de ce phage dans les bacteries entraine leur lyse, 
ce qui libere un grand nombre de descendants. La majorite de ces 
phages est identique au phage infectant. Exceptionnellement, la capside 
renferme un fragment d’ ADN du chromosome bacterien integre dans 
la molecule d’ADN du phage. Quand on infecte une culture de bacteries 
leu - par le lysat contenant 1’ ensemble des phages, certains de ceux qui 
ont « embarque » un petit fragment de chromosome bacterien intro- 
duisent dans les bacteries receptrices le gene leu + . Par recombinaison, 
L allele leu + peut se substituer a 1’ allele leu - et la bacterie se trouve 
transduite pour ce caractere. Tout fragment de l’ADN de la bacterie 
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donneuse portant un marqueur genetique pourra se trouver transduit 
de la sorte. On parle alors de transduction generalisee (Fig. 4.8). 

II existe un autre type de phages transducteurs qui ne transportent 
qu’une partie restreinte et bien determinee du chromosome bacterien 
du fait d’une insertion du transducteur en une position precise du 
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Bacterie transduite portant 
le caractere Leu + 


Figure 4.8 Mecanisme de la transduction generalisee. Le gene leuB code la 
P-isopropylmalate deshydrogenase, enzyme impliquee dans la voie de biosyn- 
these de la leucine. L'allele mute de ce gene est note Leub. 
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chromosome bacterien. Ce phenomene est appele transduction specia- 
lisee. Le phage X, phage tempere, constitue un bon exemple de trans- 
ducteur specialise. L’induction du prophage X de la bacterie E. coli 
lysogene entraine la production de certaines particules defectueuses 
due a une excision incorrecte du prophage. Le genome du phage 
emporte avec lui un fragment d’ADN du chromosome d ’£. coli alors 
que certains genes phagiques restent dans le chromosome bacterien 
(Fig. 4.9). Cet ADN phagique anormal, portant des genes bacteriens 
gal ou bio proches du site d’integration (on appelle ces phages /Ulgal 
pour ?i-defectueux gal, ou Adbio), peut etre empaquete et infecter 
d’autres bacteries. Si une particule phagique normale infecte egalement 
la bacterie (double infection) A.dgal peut s’integrer dans le genome de 
l’hote au site specifique de fixation du phage X. Ainsi, les genes gal 
sont transduits chez la deuxieme bacterie infectee. 

Les sequences appelees att (« attachement ») contenant les sites 
specifi ques sur 1’ ADN phagique (< attP ) et sur le chromosome bacterien 
(attB) ne contiennent qu’une Ires courte region d’homologie. La reaction 
d’integration est catalysee par 1’ enzyme Int (integrase) synthetisee 
par le bacteriophage X de fagon abondante au debut de 1’ infection. 
Participe egalement a cette catalyse une proteine accessoire d ’E. coli 
appelee IHF (Integration Host Factor : facteur d’integration a l’hote). 

L’integration du phage X est reversible et son excision necessite une 
seconde enzyme Xis (excisionase) synthetisee elle aussi par le phage. 
La formation d’un complexe entre 1’ integrase et Xis catalyse 1’ excision 
du prophage, ce qui permet de reconstituer un ADN bacterien et un 
ADN phagique intacts (Fig. 4.9). 

La transduction generalisee peut etre exploitee pour cartographier 
le chromosome bacterien, c’est la cartographic par transduction. 
Supposons que Ton souhaite determiner les positions relatives des 
marqueurs genetiques a + , b + , c + sur le chromosome bacterien. On peut 
faire croitre par exemple le phage transducteur PI en infectant une 
souche a + , b + , c + , puis avec les phages obtenus, on infecte une souche 
a - , b~, c~. Si l’examen des phages transduits pour le marqueur a + 
montre que 50 % d’ entre eux porte egalement b + et 2 % c + , on pourra 
interpreter ce resultat comme signifiant que le marqueur a + est plus 
proche de b + que de c + . 

Si maintenant on selectionne les transduits pour le marqueur c + et 
qu’on observe, parmi eux, 3 % contenant a + et aucun b + , cela indique 
que c + est plus proche de a + que de b + . Comme la premiere expe- 
rience montre que b + est plus proche de a + que ne l’est c + , le marqueur 
a + se trouve sur le chromosome bacterien entre b + et c + , mais plus 
proche de b + que de c + . Le principe du raisonnement est base sur le 
fait que plus deux marqueurs sont proches l’un de l’autre, plus ils ont 
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Figure 4.9 Integration du phage A et mecanisme de la transduction specialisee. 

Le bacteriophage A s'integre toujours dans la meme region entre gal et bio par crossing- 
over. Les sequences attP contenant les sites specifiques sur I'ADN phagique et attB sur 
le chromosome bacterien contiennent une tres courte region d'homologie qui permet 
la recombinaison. ^induction du prophage entraine I'excision normale de I'ADN du 
phage A. Rarement, le phage A peut s'exciser incorrectement et emporter avec lui un 
fragment d'ADN du chromosome bacterien (gal + dans le cas present). Les particules 
phagiques ainsi formees sont deficientes car certains genes A sont restes dans le chromo- 
some de I'hote, on les appelle : A dgal, De la meme fa<;on,on parle de A dbio. Cependant, 
il est tout a fait possible d'utiliser ces particules pourtransduire une autre bacterie en 
realisant une cotransduction avec un phage A sauvage. 


de chances d’etre cotransduits. L’etude de plusieurs marqueurs geneti- 
ques permet par cette maniere qui utilise la frequence de recombinaison, 
de cartographier une region du chromosome bacterien, c’est-a-dire 
d’ordonner les marqueurs les uns par rapport aux autres. 
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4.3 TEST DE COMPLEMENTATION 

OU TEST D'ALLELISME FONCTIONNEL 

Avec la decouverte que les genes etaient constitues d’une succession 
de nucleotides organises en double helice, il devint tres clair qu’une 
telle entite pouvait etre definie par un ensemble de sites mutationnels 
detectes au meme locus et engendrant le meme phenotype mutant. 
Cependant, les approches experimentales decrites ci-dessus ne permet- 
taient pas d’etablir les limites d’un gene. Le test qui s’est revele etre un 
bon indicateur des limites d’un gene etait celui de la complementation. 

Les travaux genetiques realises sur le locus rll du phage T4, par 
Benzer (1961), constituent un bon exemple non seulement pour 
comprendre ce test de complementation, mais aussi pour aborder la 
structure fine du gene. Le locus rll du phage T4 est forme de deux 
genes contigus {rll A et rllB ) dont les produits regulent la duree du 
cycle du phage. Les plages de lyse produites par le phage sauvage T4, 
lorsqu’on l’inocule sur la souche d’E. coli B, se distinguent facilement 
de celles engendrees par 1’ infection de la meme souche B, soit par des 
mutants rll A soit par des mutants rllB. Dans le premier cas (phage 
sauvage), on observe la formation de petites plages de lyse alors que 
celles-ci sont nettement plus grandes dans le second cas (phages 
mutants). II existe une autre souche, E. coli K 12 (A) sur laquelle seul le 
phage T4 de type sauvage peut se multiplier en produisant d’ailleurs 
le meme phenotype de plages que sur la souche B. En revanche, les 
mutants rll A ou rllB arrivent a injecter leur ADN dans E. coli K12 (A) 
mais ne peuvent pas se reproduire (Fig. 4.10). Par contre, lorsque 
E. coli K12 (A) est infectee simultanement par deux mutants rllA et 
rllB (croisement entre phages), on s’apergoit alors que l’infection est 
suivie de l’apparition, surun milieu nutritif gelose, d’un grand nombre 
de plages de lyse. Ceci demontre que les genes rllA et rllB assurent 
des fonctions differentes (deux genes differents), chacune necessaire 
a la multiplication sur E. coli K12 (A). De fa^on plus generate, cette 
experience indique que deux genomes reunis dans une meme cellule 
peuvent se complementer l’un 1’ autre lorsqu’ils sont mutes dans des 
genes differents (le verbe complementer est un neologisme devenu 
necessaire en genetique). Ceci constitue un test de complementation. Par 
exemple, lors de 1’ infection par le seul mutant rllB, le produit du gene 
rllA est synthetise et fonctionnel mais 1’ absence du produit fonctionnel 
du gene rllB empeche le developpement du phage. De la meme maniere, 
quand on infecte par le seul mutant rllA, la fonction du produit du 
gene rllB est assuree mais elle est insuffisante pour le developpement 
du phage en l’absence de la fonction du gene rllA (Fig. 4.10). 
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Figure 4.10 Representation schematique du test de complementation pour 
I'etude du locus rll chez le phage T4. 

a) Infection par un mutant rllA ; b) Infection par un mutant rllB ; c) Infection mixte par 
les deux mutants rllA et rllB, il y alors complementation et production de particules 
phagiques, les deux genes sauvages fonctionnels rllA et rllB etant presents dans la 
meme bacterie. Dans tous les cas, I'ADN bacterien n'est pas represente. 


Jusqu’aux annees 1940, le test de complementation a ete largement 
pratique, notamment pour savoir si deux mutants ayant le meme 
phenotype et obtenus independamment etaient affectes dans la meme 
fonction (meme gene) ou dans des fonctions differentes (deux genes 
differents) sans les connaitre obligatoirement. S’il y avait une comple- 
mentation entre les deux mutations reunies dans une cellule (pheno- 
type sauvage), on concluait que les deux mutations affectaient deux 
genes differents. Au contraire, s’il n’y avait pas de complementation 
(phenotype mutant), on concluait que le phenotype observe, obtenu 
independamment, etait du a la mutation d’un meme gene. Ainsi 
1’ absence de complementation revelee par ce test genetique est une 
preuve d’allelisme qui indique que les mutations sont localisees dans 
les limites d’un gene mais cette preuve ne renseigne pas sur la locali- 
sation des mutations les unes par rapport aux autres a l’interieur d’un 
gene : elles peuvent occuper exactement le meme emplacement ou, 
frequemment, des emplacements differents. 

© 
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4.4 TEST D'ALLELISME STRUCTURAL 

Lorsqu’on s’est apergu que la recombinaison, longtemps consideree 
comme n’ayant lieu qu’entre deux genes, pouvait avoir lieu a l’interieur 
meme d’un gene, l’ancien test de complementation fut remplace par 
deux tests. Le test d’allelisme fonctionnel ou test de complementation 
indique si deux mutations appartiennent ou non au meme gene, c’est- 
a-dire si elles sont ou non alleliques. Le test d’allelisme structural 
revele que des mutations appartenant au meme gene, done alleliques, ne 
complemented pas mais peuvent cependant subir une recombinaison. 

La preuve sans equivoque que la recombinaison peut avoir lieu a 
1’interieur meme d’un gene a ete foumie par l’etude des genes rllA et 
rllB du bacteriophage T4 en utilisant le test d’allelisme structural 
(Fig. 4.11). La cotransfection de la souche d 'E. coli B par deux mutants 
rllAl et rIIA2 permet d’obtenir un lysat de particules phagiques. La mise 
en evidence d’une recombinaison intragenique (a l’interieur du meme 
gene) lors de cette cotransfection est basee sur l’infection de la bacterie 
E. coli K12 (A) avec les phages produits par la souche B. En effet, seuls 
des recombinants ayant acquis le type sauvage peuvent se developper 
sur E. coli K12 (A). Dans cette experience, on obtient quelques plages de 
lyse (phages sauvages) pour un grand nombre de croisements testes, au 
contraire du resultat obtenu lors du test de complementation. Cette expe- 
rience a permis de montrer 1’ apparition de phages de type sauvage en 
croisant deux phages mutes au niveau d’un meme gene ce qui confirme 
que la recombinaison est tout a fait possible a l’interieur d’un meme 
gene. On parle de recombinaison intragenique (Fig. 4.11). L’etude 
d’un grand nombre de mutants des genes rllA et rllB revele un large 
eventail de frequences de recombinaison intragenique. Cette gamme de 
valeurs indique que certaines mutations peuvent etre plus ou moins 
rapprochees, ce qui permet de construire une carte genetique precise et 
de definir une structure fine pour chacun des genes. 

4.5 GENETIQUE DE LA LEVURE 

Cet eucaryote unicellulaire presente un cycle de reproduction haplo- 
diplobiontique (Fig. 4.12), tout a fait interessant pour les geneticiens. 

Ainsi, de tres nombreux mutants ont ete obtenus avec la levure 
Saccharomyces cerevisiae dont les etapes du cycle de reproduction 
sont totalement controlees au laboratoire par les geneticiens. Des 
mutants affectes dans le cycle cellulaire ont pu etre isoles chez la 
levure. Bien evidemment, les genes intervenant dans le cycle cellulaire 
sont des genes essentiels ou indispensables, il a done ete necessaire de 
caracteriser des mutants conditionnels qui presented un phenotype 
sauvage viable dans des conditions dites permissives et un phenotype 
mute letal dans des conditions dites non permissives. Les geneticiens 
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Figure 4.1 1 Selection de recombinants intrageniques du gene rllA du phageT4. 

Deux mutants du meme gene rllA ( rllAl et rllA2) sont mis ensemble en contact de la 
bacterie apres leur developpement simultane dans E. coliB (obtention de recombinants 
sauvages potentiels). Les phages obtenus sont utilises pourinfecter£co//f(J2(A.).On 
constate I'apparition de quelques plages de lyse qui temoignent d'une recombinaison 
intragenique entre les deux alleles mutes reconstituant le gene rllA sauvage. L'infection 
par les simples mutants rllA 1 ou rllB tout comme par les doubles mutants ne revelent 
aucun developpement phagique sur E. coli K12 (k). 
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Figure 4.1 2 Cycle d e reproduction haplodiplobiontique d e la levure Saccharomyces 
cerevisiae. 

La levure peut proliferer par reproduction vegetative, en se divisant par bourgeonnement, 
aussi bien a I'etat haploide qu'a I'etat diploide. Le passage a I'etat diploide s'effectue 
par fusion de deux cellules haploides de signes sexuels opposes ( a et a). Une cellule 
diploide peut subir la meiose et donner 4 spores, qui apres germination donneront 
2 colonies haploides de signe sexuel a et 2 colonies haploides de signe sexuel a. 


ont eu l’idee de rechercher des mutants thermosensibles (ts). A tempe- 
rature permissive (20 °C), les levures presentent un phenotype sauvage, 
elles se divisent. A temperature non permissive (37 °C), elles presentent 
un phenotype mutant, elles ne se divisent pas. 

Les mutations qui augmentent ou diminuent la fonction du produit 
d’un gene sont extremement utiles pour l’etude d’un systeme cellulaire. 
L’effet de la mutation (phenotype) donne des indications sur la proteine 
elle-meme et sur la voie dans laquelle elle agit. 

Les mutants peuvent etre obtenus par : 

> mutagenese au hasard (agents mutagenes), elle a pour but de lier 
une fonction a un ou plusieurs genes. En general, on cible le genome 
dans son entier ; 
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> mutagenese in vitro sur un gene donne afin d’ identifier les domaines 
fonctionnels d’une proteine et/ou d’un ARN ; 

> mutagenese ciblee, un gene est specifiquement inactive ou altere. 
Apres avoir identifie les differents mutants, leur caracterisation 

s’effectue par : 

> l’etude phenotypique detaillee avec d’eventuels cribles secondaires ; 

> la determination du caractere dominant ou recessif de la mutation ; 

> la verification du nombre de mutations liees au phenotype (segre- 
gation 2/2 de la mutation apres croisement avec la souche paren- 
tale) ; 

> on categorise les mutants par groupes de complementation. 

Les groupes de complementation 
et denombrement des genes 

La genetique de la levure est essentiellement basee sur la possibility 
de croiser deux souches haploides portant des mutations differentes 
pour former une souche diploide. L’induction de la sporulation du 
diploide permettra l’obtention d’une tetrade dont les spores isolees par 
dissection avec un micromanipulateur formeront chacune une colonie. 
Par le passe, ces croisements ont permis d’etablir les cartes chromoso- 
miques en utilisant la frequence de recombinaison entre deux mutations 
comme mesure de la distance genetique. Les croisements sont utilises 
aujourd’hui pour generer des souches avec de nouvelles combinaisons 
de mutations et pour analyser les relations genetiques entre differentes 
mutations. 

L’ analyse genetique d’une voie metabolique ou physiologique 
consiste a denombrer le nombre de genes impliques dans celle-ci, a 
identifier la fonction biochimique pour chacun d’eux, voire leurs inter- 
actions eventuelles, etc. En obtenant le maximum de mutants pour une 
voie etudiee, on s’ assure de « toucher » tous les genes impliques dans 
cette voie, a 1’ exception des genes dont la mutation serait letale. En 
croisant entre eux tous les mutants recessif s, on construit des groupes 
de complementation. Un groupe de complementation est constitue d’un 
ensemble de mutants ne complementant pas entre eux et qui de ce fait 
ont le meme gene mute. Ainsi, si : 

> les deux mutations sont dans le meme gene, la souche diploide aura 
le meme phenotype mutant que les haploides ; 

> les deux mutations sont dans deux genes differents, le diploide aura 
un phenotype sauvage, chaque haploide apportant une copie de 
1’ autre gene sauvage. 

Le nombre de groupes de complementation obtenu par 1’ analyse 
fonctionnelle des croisements entre les divers mutants de la voie 
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etudiee indique le nombre minimal de genes impliques dans cette voie 
(Fig. 4.13). 
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Figure 4.13 Determination du nombre de groupes de complementation et par 
analogie du nombre minimal de genes impliques dans une voie metabolique (a). 
Les differents mutants sont croises entre eux et avec un haploi'de sauvage. Les 
diploTdes obtenus sont mis en culture, les resultats obtenus sont reportes dans le 
tableau (b).On observe trois groupes de complementation {c),on peut en condure 
qu'au moins trois genes differents sont impliques dans cette voie de biosynthese. 
(-) pas de complementation, done probablement les mutations sont dans le meme 
gene pour les deux mutants ; (+) complementation, done les mutations affectent 
deux genes distincts. Le croisement avec le sauvage verifie que les mutations ne 
sont pas a effet dominant. 


Invalidation de genes chez la levure 

L’invalidation de genes est basee sur la disorganisation selective 
d’un gene. Chez la levure, cette technique est facilitee, par la relative 
frequence de la recombinaison homologue. De plus, son cycle de 
reproduction haplodiplobiontique offre la possibility de travailler sur des 
souches haploides, ce qui ne necessite pas l’obtention d’une invalidation 
homozygote. Chez la levure, cette technique permet entre autres de 
classer les nouveaux genes en deux categories. Par l’analyse genetique 
d’une souche diploide ou l’invalidation du gene etudie est a l’etat 
heterozygote (Fig. 4.14), on peut determiner si le gene en question est 
essentiel a la viabilite ou non. 
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Figure 4.14 Invalidation de gene chez la levure. 

En a, dans une premiere serie d'experimentations, le gene est invalide en le rempla^ant 
par un marqueur de selection (ici, URA3). Puis Integration au genome de la levure est 
effectuee par une recombinaison homologue, basee sur un double crossing-over. En b, 
Tanalyse genetique de la descendance de la souche de levure heterozygote pour 
Tinvalidation montre, suivant le cas, si le gene invalide est essentiel ou non. S'il est 
essentiel, les 2 spores haploTdescontenant le gene invalide ne forment pas de colonies. 


V 

A l’inverse, on peut introduire par recombinaison, une mutation au 
locus du gene X invalide par URA3, en utilisant precisement le 
marqueur URA3 comme temoin positif de la transformation. Cette 
technique est basee sur le fait qu’on peut contre-selectionner le 
marqueur URA3 en presence d’acide 5-fluoro-orotique (FOA). En effet, 
URA3 code Forotidine 5’ -phosphate decarboxylase qui convertit FOA 
en 5-fluoro-uracile, toxique pour la cellule. Les cellules haploides (Ura - ) 
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ayant regu par double recombinaison le gene X mute a la place du 
gene X invalide par URA3, survivront apres etalement sur boite conte- 
nant FOA, alors que les cellules non recombinantes contenant encore 
URA3 (ura + ) seront tuees par le 5-fluoro-uracile. 

Les levures eucaryotes modeles et outils 

Les levures sont considerees comme des organismes modeles. On 
anticipe qu’une partie au moins des systemes cellulaires fonctionne 
de fagon similaire chez la levure et chez 1’homme et par extension chez 
tous les eucaryotes. Ceci est vrai et de nombreux processus mis en 
evidence ou etudies chez la levure se sont reveles en partie conserves 
chez les mammiferes bien qu’avec des niveaux de complexity plus 
eleves comme : 

> la regulation du cycle cellulaire ; 

> la transmission des signaux extracellulaires ; 

> les regulations de l’expression des genes ; 

> le trafic intracellulaire ; 

> le vieillissement. . . 

Pour le vieillissement, on a pu etablir un parallele entre la duree de 
vie predeterminee de la cellule mere qui meurt apres 40 a 50 genera- 
tions et celle de la plupart des cellules d’ eucaryotes superieurs. Des 
genes impliques dans le vieillissement ont ete ainsi identifies. Par 
exemple, des mutations du gene WRN (Werner’s syndrom) chez 
l’homme et de son homologue SGS] chez la levure provoquent des 
senescences precoces. La collection de mutants de levure a ete mise a 
profi t pour le clonage de genes heterologues, et ainsi de nombreux 
genes de mammiferes ou de plantes ont ete clones par complementa- 
tion de mutants de levure (voir dans la meme collection l’ouvrage 
Biologie moleculaire). 


Figure 4.15 Production d'insuline recombinante humaine par E.coli. > 

L'insuline est composee de deux sous-unites a et p. Chacune d'elles est produite 
separement. Dans un vecteur d'expression, portant un marqueur de selection, le 
gene de resistance a I'ampicilline ( Amp ') on introduit la sequence codant I'une ou 
I'autre des chaines en aval du gene Lac Z place sous la dependance de promoteur 
bacterien. Les bacteries sont transformees et mises en culture sur un milieu 
contenant de I'ampicilline. Les clones resistants a I'ampicilline sont utilises pour 
une culture en masse. La proteine chimerique Lac-Z sera synthetisee dans les 
bacteries. Apres arret de la culture les bacteries sont lysees et les proteines purifiees. 
Le divage des proteines chimeriques s'effectue par traitement au bromure de 
cyanogene qui rompt la liaison peptidique entre la methionine de LacZe t la phenyl- 
alanine porte par la chaine d'insuline. Les chaines a et p sont purifiees, se replient et 
des pontsdisulfure s'etablissent entre les cysteines portees par les deux sous-unites. 
La molecule d'insuline est active et peut etre injectee pour traiter des diabetes de type I. 
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4.6 MICRO-ORGANISMES ET GENIE GENETIQUE 

La technologie de 1’ ADN recombinant utilisant differentes cellules hotes 
a permis la biosynthese de grandes quantites de proteines d’interet 
commedes proteines humaines qui n’etaient jusque la disponibles qu’en 
tres petites quantites. La premiere proteine qui fut exprimee est la 
somatostatine, un peptide neurotransmetteur de 14 acides amines. 
Depuis, de nombreuses proteines recombinantes ont vu le jour avec 
comme application premiere le traitement de maladies immuno- 
logiques, neurologiques, infectieuses, genetiques, etc. Un des succes de 
la technique est la fabrication de vaccins contre les maladies infectieuses. 
Elle consiste a produire la proteine de surface du pathogene qui servira 
alors d’ antigene. Le premier vaccin reussi est celui de 1’ hepatite B, la 
proteine immunogene etant produite chez la levure. Des molecules 
recombinantes sont meme retrouvees dans des compositions de deter- 
gents et de produits alimentaires. 

La strategic generate de production de ces differentes molecules 
consiste a cloner le gene d’interet dans un vecteur, appele vecteur 
d’expression, qui est ensuite transfere dans une cellule qui peut assurer 
son expression. Les vecteurs derivent des plasmides presents naturel- 
lement dans les bacteries et les levures. Les systemes d’expression 
les plus utilises sont procaryotes, E. coli et B. subtilis, et eucaryotes, 
levures, cellules d’insectes et cellules de mammiferes. Les procaryotes 
ne sont pas souvent de bons candidats pour la production de proteines 
humaines notamment quand celles ci necessitent des modifications 
post-traductionnelles pour etre actives. 

Generalement, les molecules recombinantes sont produites pour 
augmenter la quantite d’une molecule deja existante et extraite de 
tissus animaux. L’insuline par exemple etait purifiee a partir de 
pancreas de pores sacrifies a l’abattoir. La premiere insuline recombi- 
nante humaine est apparue sur le marche pharmaceutique en 1982. 
Cette insuline a pu etre produite a l’echelle industrielle, et a des couts 
moindres grace a 1’ utilisation de bacteries et des techniques de 1’ADN 
recombinant (Fig. 4.15). Elle permet de traiter les patients atteints de 
diabetes de type I. Depuis un grand nombre de « proteines medica- 
ments » sont produites par des bacteries comme des hormones de 
croissance, 1’ interferon, des interleukines, etc. 

Le genie genetique permet d’obtenir aussi des proteines dont la struc- 
ture naturelle est modifiee afin d’ameliorer ou de modifier leur fonction. 

V 

A titre d’ exemple, la subtilisine, protease a serine utilisee dans les deter- 
gents, est sensible aux autres produits employes dans le blanchiment a 
cause de l’oxydation de la methionine 222. Par mutagenese dirigee, 
plusieurs formes mutees de la subtilisine ont ete produites ou la methio- 
nine a ete remplacee par d’ autres acides amines. II a ete ainsi possible de 
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selectionner une subtilisine mutante (possedant 1’ alanine 222) moins 
active que la sauvage mais insensible a l’oxydation. 



POINTS CLEFS 


> Les procaryotes ne possedent pas de noyau. Leurs genes sont regroupes 
essentiellement sur un seul chromosome circulaire. 

> Les plasmides, structures de petite taille, portent des genes, tels les genes 
de resistance a des agents chimiques, qui fournissent a la bacterie la possi- 
bility de vivre et se multiplier dans un environnement defavorable. 

> Toutes les bacteries d'une colonie isolee sur une boite sont issues d'une seule 
cellule, elles ont done toutes le meme materiel genetique et constituent 
un clone. 

> Lors de la conjugaison bacterienne, le transfert d'ADN est unidirectionnel 
de la bacterie donneuse vers la bacterie receveuse. 

> Au cours de la conjugaison, un contact physique s'etablit entre les deux 
bacteries grace notamment a Taction de pili sexuels codes par le facteur F. 

> Le facteur F est un plasmide qui peut s'integrer dans le chromosome 
bacterien, la bacterie est alors nominee Hfr pour Haute frequence de 
recombinaison. 

L'origine et la direction du transfert sont determinees par la meme extre- 
mity du facteur F,appelee origine de transfert. Lors de la conjugaison d'une 
bacterie Hfr avec une bacterie F\ Tinformation genetique du facteur F sera 
toujours transferee en dernier lieu apres transfert de tout le chromosome 
de la souche Hfr. 

> Par des experiences de conjugaison bacterienne interrompue, on a pu faire 
la cartographie du chromosome bacterien. 

> Les vecteurs transportant les multiples resistances d'une cellule a une autre 
appartiennent a un groupe de plasmides, les plasmides R. 

> Le mecanisme par lequel une bacterie absorbe de I'ADN exogene a partir de 
son environnement et Tintegre de fa^on fonctionnelle dans son chromosome 
est appele transformation. 

> La capacite qu'ont les bacteries a absorber naturellement des fragments 
d'ADN exogene en solution, processus nomine competence naturelle, est 
genetiquement definie. 

> Les bacteriophages (ou phages) sont des virus qui infectent les bacteries. 

> Un prophage est constitue par I'ADN d'un phage a I'etat integre dans le 
chromosome de I'hote bacterien. 
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> De courtes sequences d'ADN bacterien peuvent etre transmise de fa^on 
passive d'une bacterie a une autre par I'intermediaire d'un bacteriophage. 
C'est la transduction. 

> Certains phages transducteurs ne transportent qu'une partie restreinte et 
bien determinee du chromosome bacterien du fait d'une insertion du 
transducteuren une position precise du chromosome bacterien.Ce pheno- 
mene est appele transduction specialises 

> Le test d'allelisme fonctionnel ou test de complementation indique si deux 
mutations appartiennent ou non au meme gene, c'est-a-dire si elles sont 
ou non alleliques. 

> Les mutants conditionnels presentent un phenotype sauvage viable dans 
des conditions dites permissives et un phenotype mute letal dans des 
conditions dites non permissives. 

> Un groupe de complementation est constitue d'un ensemble de mutants 
ne complementant pas entre eux et qui de ce fait ont le meme gene mute. 

> L'invalidation de genes est basee sur la disorganisation selective d'un gene. 

> Les levures sont considerees comme des organismes modeles. Une partie 
au moins des systemes cellulaires fonctionne de fa^on similaire chez la 
levure et chez tous les eucaryotes. 

> La production de proteines recombinantes s'effectue par insertion de la 
sequence codant la proteine d'interet dans un vecteur d'expression qui 
est ensuite transfere dans une cellule competente qui peut assurer son 
expression. 


QCM - QROC 

4.1 Quelle est la bonne affirmation ? 

a) Les genes bacteriens sont portes par un seul chromosome lineaire. 

b) Les bacteries gal~ utilisent le galactose comme source de carbone. 

c) Les genes de resistances aux antibiotiques sont utilises comme 
marqueurs. 

d) L’auxotrophie correspond a la capacite d’une bacterie a proliferer 
sur milieu minimum. 

4.2 Quelles propositions sont exactes : 

a) Le facteur F n’est pas integre dans le chromosome d’une bacterie 
Hfr. 

b) Les pili sexuels relient deux bacteries F + lors de la conjugaison. 

c) Le transfert d’ADN d’une bacterie Hfr vers une bacterie F _ est 
unidirectionnel. 

d) C’est sous la forme monobrin que l’ADN est transfere lors de la 
conjugaison. 
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e) L’ADN transfere a la bacterie F _ s’integre de fagon aleatoire dans 
son chromosome. 

4.3 En quoi la transduction differe de la transformation ? 

4.4 Le phage dans le cas de la transduction specialisee : 

a) emporte des regions specifiques du genome bacterien ; 

b) encapside la totalite de son ADN ; 

c) porte le nom du gene bacterien qu’il a emporte ; 

d) ne peut integrer son ADN au chromosome de l’hote que s’il y a une 
double infection necessitant la presence d’une particule phagique 
normale. 

4.5 Peut-il y avoir recombinaison entre les genomes des virus bacteriens ? 

4.6 Quelle est la bonne proposition : 

a) Un groupe de complementation est defini comme un ensemble de 
mutants qui n’ont pas les memes genes mutes. 

b) Le nombre de groupes de complementation obtenu apres croisement 
des mutants entre eux permet de definir le nombre maximum de genes 
presents dans une voie metabolique etudiee. 

c) Chez la levure le croisement de mutants ayant chacun une mutation 
recessive donnera un phenotype sauvage au diploide heterozygote. 

d) Si les deux mutations sont dans le meme gene, le diploide aura le 
meme phenotype mutant que les haploides. 

4.7 Chez E. coli, 3 souches Hfr, derivees de la meme souche F + , trans- 
feree une serie de marqueurs dans l’ordre suivant : 

- Hfrl : ACBDF ; 

- Hfr2 : LKJFD ; 

- Hfr3 : SEMLK. 

Donner l’ordre des marqueurs sur le chromosome circulaire de la 
bacterie F + dont derivent les 3 souches Hfr. 

4.8 Un bacteriophage possede les genes dans l’ordre suivant : gl, g2, 
g3, g4, g5, g6, g7 et g8 ; alors que son prophage les a dans un autre 
ordre g6, g7, g8, gl, g2, g3, g4 et g5. Quelle information vous apporte 
cette permutation ? 


REPONSES 


4.1 c) Vraie ; faux : a) le chromosome est circulaire, b) la bacterie ne 
metabolise pas le galactose, d) l’auxotrophie traduit 1’ incapacity a 
synthetiser des metabolites qui doivent etre ajoutes au milieu de culture. 
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4.2 c) et d) vraies ; faux a) le facteur F est integre au chromosome de la 
bacterie Hfr, b) ils relient les bacteries Hfr ou F + a une bacterie F _ , 
e) l’ADN s’ integre par recombinaison homologue. 

4.3 Les phages servent d’ intermediate pour le transfert d’ ADN d’une 
bacterie a une autre ; la transformation concerne des fragments 
d’ADN libre dans le milieu. 

4.4 a), c) et d) vraies, b) faux, 1’ intermediate en boucle qui se forme 
entraine une excision erronee, certains genes phagiques restent dans 
le chromosome bacterien. 

4.5 Oui, si deux types de phages legerement differents infectent 
simultanement une bacterie hote (voir Deux mutants du meme gene 
rllA (rllAl et rIIA2) sont mis ensemble en contact de la bacterie 
apres leur developpement simultane dans E. coli B (obtention de 
recombinants sauvages potentiels). Les phages obtenus sont utilises 
pour infect er E. coli K12 (l). On constate V apparition de quelques 
plages de lyse qui temoignent d’une recombinaison intragenique entre 
les deux alleles mutes reconstituant le gene rllA sauvage. L ’infection 
par les simples mutants rllAl ou rllB tout comme par les doubles 
mutants ne revelent aucun developpement phagique sur E. coli K12 
(l). figure 4.11b). 

4.6 c) Vraie ; faux a) un groupe de complementation est defini comme 
un ensemble de mutants qui ont le meme gene mute, b) de definir le 
nombre minimum de genes presents dans une voie metabolique, d) si 
les deux mutations sont dans le meme gene, mais suffisamment distantes, 
il peut y avoir recombinaison homologue qui aboutira a un allele 
sauvage et un allele portant les deux mutations. 

4.7 Le l er marqueur a etre transmis est le plus proche de l’origine de 
transfert dont l’orientation impose egalement le sens du transfert. Ainsi, 
la souche Hfrl transfere en premier le marqueur A puis les autres 
marqueurs ; la souche Hfr2 transfere elle en premier le marqueur L. 
On constate que F et D sont communs aux deux souches, mais dans 
un ordre inverse. Done, pour la souche Hfr2, l’origine de transfert est 
inversee par rapport a Hfrl . On observe egalement une inversion des 
marqueurs communs L et K transmis par Hf r 2 et 3. En orientant les 
sequences de ces 2 souches par rapport a Hfrl, 1’ ordre des marqueurs 
sur la souche d’origine est : ACBDFJKLMES. 

4.8 On en deduit la position du site d’attachement Att qui permet 
1’ integration de l’ADN phagique par recombinaison homologue 
(Fig. 4.9). II se situe entre les genes g5 et g6. 
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5.1 Expression des genes : la transcription de I'ADN 

5.2 Expression des genes : I'epissage alternatif des transcrits 

5.3 Expression des genes : regulation traductionnelle 

5.4 Regulations epigenetiques de I'expression des genes 

5.5 Les reseaux de regulation de I'expression des genes 

5.6 La genomique en sante humaine et pour la selection animale 



Etudier les differents aspects de I'expression des genes 

Accorder une attention speciale aux modifications epigenetiques 

Aborder certains aspects lies aux analyses a grande echelle 

Aborder les aspects integres de la genetique et des autres disciplines de la 
biologie 


On designe par le terme « expression des genes » le processus mole- 
culaire et cellulaire qui consiste a convertir la sequence ADN des genes 
en proteines fonctionnelles. Les differentes etapes de ce processus 
sont modulables depuis l’etape de la transcription de I’ADN en ARN 
jusqu’aux modifications post-lraductionnelles des proteines. On designe 
habituellement ces modulations par le concept de « regulation des 
genes ». II est a la base de la comprehension du fonctionnement courant 
des cellules et organismes. Les mecanismes mis en jeu dans cette 
regulation sont egalement la cible de changements mutationnels dont 
les effets se manifestent a la fois dans le controle du metabolisme et 
dans 1’evolution des etres vivants. 

5.1 EXPRESSION DES GENES : LA TRANSCRIPTION DE L'ADN 

Les proteines necessaires a la transcription 

Les mecanismes de la transcription reposent sur l’activite d’une 
famille d’ enzymes, les ARN polymerases, qui realisent le meme type 
de reaction (une synthese d’ ARN a partir d’une matrice d’ ADN) quelle 
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que soit la cellule procaryote ou eucaryote consideree. Les ARN poly- 
merases se fixent a des regions de l’ADN designees sous le terme de 
promoteurs, souvent avec l’aide de proteines additionnelles. Elies cata- 
lysent ensuite par differentes etapes bien definies la polymerisation des 
ribonucleotides triphosphates precurseurs en un polynucleotide mono- 
catenaire dont la sequence est complementaire du brin d’ADN ayant 
servi de matrice modele (brin transcrit). L’autre brin d’ADN qui n’est 
pas transcrit est dit parfois brin codant car il possede une sequence 
identique a celle du transcrit d’ARN. Les ARN polymerases adoptent 
une structure tridimentionnelle en forme de pince ce qui leur permet 
d’enserrer le brin d’ADN (oriente dans le sens 3’ — » 5’) et en coulissant 
de le transcrire en un ARN oriente dans le sens 5’ — > 3’. Bien que le 
mecanisme general chez les eucaryotes s’apparente a celui des proca- 
ryotes, il s’en distingue cependant par une intervention beaucoup plus 
complexe de nombreux facteurs de transcription indispensables a la 
formation specifique de 1’ association entre ARN polymerases et 
promoteurs et au demarrage efficace de la transcription. On distingue a 
cet effet les facteurs generaux de la transcription, suffisants pour 
reconstituer le processus in vitro, et les facteurs additionnels organises 
en complexes mediateurs indispensables a la transcription in vivo. 

Les ARN polymerases s’attachent aux promoteurs de fagon faiblement 
spontanee et la transcription peu active, constitutive, qui en resulte se 
situe a un niveau basal. Un represseur occupant un operateur, c’est- 
a-dire un site chevauchant le promoteur sera alors suffisant pour inhiber 
la transcription. A 1’ inverse, un activateur occupant son site souvent a 
proximite du promoteur aidera la fixation de la polymerase (Fig. 5.1). 
Ce recrutement de 1’ enzyme par un activateur est un bon exemple de 
cooperation entre proteines dans la realisation d’une fonction molecu- 
laire elementaire : ici le demarrage de la transcription. La regulation 
de l’operon lactose (voir plus loin) se rattache a ce type de mecanisme. 


Promoteur 



Figure 5.1 Schema illustrant le role d'un activateur dans le recrutement d'une 
ARN polymerase a son promoteur. 

Lorsque le represseur occupe son site, il exclut par competition I'enzyme de son 
promoteur. 
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Au cours de la transcription et avant meme que 1’ ARN ne soit exporte 
hors du noyau de la cellule eucaryote pour etre ensuite traduit (dans le 
cas d’un ARNm), il subit une serie de modifications qui concourent a 
la production a partir du transcrit primaire d’un ARN dit mature, apte 
a assurer les fonctions auxquelles il est destine. Dans l’ordre ou elles 
interviennent on distingue pour les ARNm : l’addition d’une coiffe a 
l’extremite 5’, l’epissage des introns et l’addition d’une queue de 
polyadenylation a l’extremite 3’ (voir Fig. 5.7 , 5.10 et Mini Manuel 
de Biologie moleculaire). 

L'exemple historique de I'operon lactose de E. Coli 

L’operon lactose comporte trois genes adjacents denommes lacZ, 
lacY et lac A ( Fig 5.2). Le premier code la (3-galactosidase, une enzyme 
qui hydrolyse le lactose en glucose et galactose, deux oses utilises par 
la cellule pour ses besoins energetiques ; lacY code une permease 
membranaire qui importe le lactose dans la cellule ; lac A code une 
transacetylase qui purge la cellule des thiogalactosides toxiques intro- 
duits par la permease. Un seul ARN messager polycistronique, transcrit 
a partir du promoteur situe en amont du gene lacZ, fournit par traduction 
les trois proteines. Elles sont produites seulement quand le lactose est 
disponible (on dit que le lactose agit comme un inducteur) et que le 
glucose est absent. 



Figure 5.2 Positionnement des divers partenaires fonctionnels de I'operon lac. 

La transcription des genes lacZ, lacY et lacA n'est effective que lorsque le lactose est 
present c'est-a-dire lorsque le represseur est inactif et I'operateur inoccupe. La proteine 
CAP complexee a I'AMPc stimule le recrutement de la polymerase uniquement en 
I'absence du glucose. 
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En presence de glucose, la bacterie utilise preferentiellement cet ose 
pour ses besoins metaboliques en energie et en composes carbones. Si 
de plus le lactose est absent, le represseur Lac reprimera fortement la 
transcription de l’operon lac. Les quantites de (3-galactosidase et des 
deux autres proteines sont produites a un niveau basal, soit environ 
5 molecules par cellule. En presence du lactose et en 1’ absence du 
glucose, le represseur devient inactif et la transcription de l’operon lac 
est dereprimee. Mais la proteine CAP activera 1’ operon lac seulement 
en l’absence du glucose. On peut denombrer jusqu’a 5000 molecules 
de (3-galactosidase par cellule lorsque 1’ operon est pleinement actif. 

Le represseur Lac et la proteine CAP sont deux exemples de proteines 
liant l’ADN en des sites specifiques et uniques par leur sequence en 
bases. Le site de l’operateur lac, reconnu par le represseur Lac, est une 
sequence partiellement palindromique de 2 1 paires de bases repetees 
et inversees, a double symetrie (Fig. 5.3). 

Chacune des deux sous-unites du represseur comporte une structure 
spatiale tres conservee par beaucoup de proteines liant 1’ ADN. Elle se 
compose de deux helices a qui sont separees par une boucle. Ce motif 
nomme helice-tour-helice s’ attache a un demi-site de l’operateur par 
l’une des helices (l’helice de reconnaissance) qui s’engage dans le 
grand sillon de l’ADN a l’aplomb de la sequence correspondante. La 
reconnaissance specifique entre l’helice proteique et la sequence en 
bases de l’ADN met en jeu des liaisons hydrogene et des interactions 
electrostatiques qui stabilisent la fixation de l’helice au demi-site de 
l’operateur lac (Fig. 5.3). 

La sequence de ce dernier chevauche la sequence du promoteur et 
lorsque le represseur est present, il empeche l’ARN polymerase de se 
fixer et inhibe la transcription de l’operon lac. Le contact entre la 
proteine CAP et son site d’attachement a l’ADN obeit a ces memes 
principes structuraux. On note la presence d’un motif helice-tour- 
helice et des interactions basees sur des liaisons faibles et nombreuses 
entre les amino-acides de l’helice engagee dans le grand sillon et les 
bases de l’ADN. L’action activatrice de la proteine CAP s’exerce par 
une interaction directe entre une region de la proteine (le domaine 
activateur) et le domaine carboxy-terminal de la polymerase. Le 
promoteur lac ne possede pas en effet d’element UP (voir le Mini 
Manuel de Biologie moleculaire ) et de ce fait, l’ARN polymerase s’y 
attache faiblement. On dit que le promoteur lac est un promoteur 
naturellement faible. Lorsque le site CAP est occupe par la proteine 
CAP, celle-ci recrute activement par son domaine d’ interaction 1’ ARN 
polymerase et stimule ainsi la transcription. 
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Figure 5.3 Organisation sommaire de la region de controle de I'operon lac 
montrant les sequences d'ADN occupees par les proteines regulatrices et I'ARN 
polymerase. La structure palindromique en demi-sites de I'operon lac est detaillee. 
L'interaction du represseur Lacsoussa forme dimerique montre le positionnement 
des helices dans le grand sillon de I'ADN. Le represseur Lac est actif sous sa forme 
tetramerique, en se liant simultanement a 2 sites operateurs, le premier chevau- 
chant le promoteur et I'autre pouvant etre situe en amont (a 90 pb) ou en aval (a 
400 pb) du premier, I'ADN formant alors une boude fermee par le tetramere. 


Une meme proteine regulatrice peut etre repressive 
ou activatrice 

La proteine « represseur » du bacteriophage X, nommee le 
represseur X, est codee par le gene cl (Fig. 5.4). Malgre son nom, 
cette proteine qui possede deux domaines, un domaine de liaison a 
I’ADN couvrant 17 pb et un domaine d’activite, peut activer ou 
reprimer la transcription. Elle existe habituellement sous la forme 
d’un dimere. Lorsqu’elle reprime, elle fonctionne comme le repres- 
seur Lac et se fixe a un operateur chevauchant le promoteur excluant 
ainsi I’ARN polymerase. Lorsqu’elle active la transcription, elle fonc- 
tionne comme la proteine CAP et recrute I’ARN polymerase. 
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La proteine Cro (Control of repressor and others things) est codee 
par le gene cro. Elle possede un seul domaine de liaison a l’ADN 
couvrant 17 pb et existe aussi sous la forme d’un dimere. Plus simple 
que le represseur X, elle reprime la transcription comme le fait le 
represseur Lac (voir aussi Mini-manuel Biologie moleculaire). 



Figure 5.4 Representation schematique de Taction respective du represseur X et 
de la proteine Cro (voir Fig. 4.7 pour le cycle du bacteriophage). 

Noter les mecanismes d'autoregulation positive et negative du represseur LPar ('occu- 
pation cooperative des operateurs 0 R2 et 0 R3 il active ou reprime sa propre synthese a 
partir de P RM . 


Les isolateurs eucaryotes 

Quand un activateur agit a longue distance (parfois a plusieurs milliers 
de kb d’un promoteur) il est inevitable que son action puisse s’exercer 
sur differents promoteurs presents dans l’intervalle. Cet inconvenient 
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semble, chez les eucaryotes, surmonte par la presence de sequences 
d’un type particulier, appelees isolateurs (ou insulateurs). Places entre 
un site activateur (enhancer) ou un site represseur (silencer) et un 
promoteur, l’isolateur inhibe l’activation ou la repression du gene par 
le stimulateur ou le represseur en bloquant la communication entre 
les deux partenaires. II n’empeche pas cependant 1’ activateur ou le 
represseur d’agir sur un autre gene, ni le gene bloque d’etre active ou 
inhibe par un autre stimulateur ou represseur (Fig. 5.5). Au total un 
isolateur en ciblant la protection d’un gene evite que des evenements 
d’ activation ou de repression sur de longues distances puissent alterer 
le fonctionnement du genome. En ce sens, les isolateurs sont des 
elements plutot specifiques des genomes complexes et de grande taille. 



Transcription 

activateur 

Transcription 

du gene 2 active 


du gene 1 active 




Figure 5.5 Illustration du mode d'action d'un isolateur. 

a) L'isolateur occupe inhibe uniquement Taction de Tactivateur sur le gene 1 . II n'interfere 
pas avec Tactivation du gene 2 ; b) l'isolateur occupe n'interfere pas avec Tactivation 
du gene 1 par un autre activateur (ici Tactivateur 2). 
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Figure 5.6 Exemple des principaux modes d'action des repressers eucaryotes. 

a) Les sites de liaisons a I'ADN sont chevauchants et la presence du represseur exclut celle 
de I'activateur ; b) les sites de liaisons sont distincts mais rapproches, le represseur peut 
inhiber par interaction directe I'effet de I'activateur ; c) le represseur occupe son site et 
agit sur la machinerie transcriptionnelle par I'intermediaire du complexe mediateur; 
d) le represseur, lie a son site, recrute une histone desacetylase qui en eliminant les 
groupes acetyles des queues d'histones,entraine une modification de la structure des 
nudeosomes et de la chromatine, dont les effets sont inhibiteurs de la transcription. 
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La regulation transcriptionnelle 
a I'echelle de la chromatine 

Contrairement au mode d’ action le plus frequemment rencontre chez 
les bacteries, les represseurs et activateurs eucaryotes n’agissent 
pas, pour inhiber ou stimuler l’attachement des ARN polymerases aux 
promoteurs, par competition et encombrement sterique du site promo- 
teur. Ils peuvent cependant interagir avec les ARN polymerases en se 
liant a des sites adjacents a ceux des promoteurs, de fagon alternative 
ou competitive. Les activateurs et represseurs eucaryotes recrutent 
frequemment des proteines modificatrices de la structure chromatinienne 
(Fig 5.6). 

5.2 EXPRESSION DES GENES : L'EPISS AGE ALTERNATIF 
DES TRANSCRITS 

Genes morceles et epissage des transcrits 

Contrairement aux genes bacteriens dont les sequences codant les pro- 
teines sont continues, la plupart des genes eucaryotes ont une sequence 
organisee en regions codantes (les exons) interrompues par des regions 
non codantes (les introns). On parle de genes en mosaiques, ou de 
genes morceles ou delates. Cependant, comme les genes bacteriens, ils 
sont transcrits en une copie ARN continue, le transcrit primaire (appele 
aussi pre-ARNm, dans le cas d’un precurseur d’ARNm). Comme le 
systeme cellulaire de traduction en proteines fonctionne d’une maniere 
a lire en continu les codons successifs, les ARN messagers eucaryotes 
sont prealablement debarrasses de leurs introns. Le pre-ARNm est 
converti en ARN messager mature grace a une machine moleculaire, 
le spliceosome, agissant avec une extreme precision sans perte d’un 
seul nucleotide ce qui aurait pour effet de rompre le cadre de lecture 
indispensable a l’obtention d’une proteine conforme a l’information 
genetique initiale. Frequemment I’epissage des introns peut se produire 
de maniere alternative (differentes combinaisons d’introns sont 
eliminees) et donner naissance pour un meme gene a divers ARN messa- 
gers matures qui tous sont susceptibles de conduire a des proteines 
fonctionnelles mais distinctes. Les differentes proteines resultant de 
la transcription d’un seul gene sont des isoformes proteiques. Elies 
peuvent avoir des fonctions similaires, differentes ou antagonistes. Un 
gene peut donner parfois naissance alternativement a plusieurs trans- 
crits. Certains s’averent parfois improductifs car ils portent un codon 
stop premature qui conduit a une proteine tronquee, non fonctionnelle 
et rapidement degradee. Ce n’est pas toujours le cas. Les diverses 
modalites d’ epissage connues sont sou vent a l’origine d’une grande 
diversite de proteines fonctionnelles. 
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Figure 5.7 Principales etapes de la reaction d'epissage des introns. 

Noter dans le schema du haut, les sequences consensus des sites d'epissage en bordures 
intron-exon et a I'interieur de I'intron (voir aussi le Mini-manuel Biologie moleculaire). 
Pyr tract : repetition de pyrimidines. 
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Epissage alternatif et regulation 

Cas general 

La consequence admise de I’epissage alternatif est de diversifier tres 
sensiblement F expression des genes eucaryotes, un phenomene qui 
est en accord avec la plus grande complexity des organismes qui les 
possedent. 
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Figure 5.8 Principes generaux de la regulation de I'epissage alternatif montrant 
les roles respectifs des sites d'epissage, du spliceosome, des sites regulateurs de 
I'epissage et des proteines regulatrices, activateurs ou repressers. 

a) Le represseur masque le site d'epissage et empeche Taction du spliceosome ; 

b) en occupant son site, I'activateur favorise le recrutement et I'activite du spliceosome. 
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A l’interieur de la sequence du transcrit primaire (pre-ARNm) au 
sein des introns, de courtes sequences consensus delimitent les frontieres 
entre exons et introns (Fig. 5.7). A l’extremite 5’ de l’intron la sequence 
s’appelle « site d’epissage en 5’ » et a 1’ autre extremite « site d’epissage 
en 3’ ». Une troisieme sequence consensus, le point de branchement, 
se trouve a l’interieur de l’intron plutot du cote 3’ et elle est suivie 
d’une sequence riche en pyrimidines. 

La regulation de l’epissage altematif ressemble beaucoup a la regu- 
lation transcriptionnelle. L’attachement de la machinerie d’epissage a 
un site d’epissage particulier depend en effet de l’affinite de ce site pour 
la machinerie et de Taction des proteines regulatrices de 1’ epissage. 
Un site d’epissage puissant favorisera un epissage constitutif. Mais 
un represseur d’epissage peut entrer en competition pour s’attacher a ce 
site et bloquer la machinerie d’epissage. Des sequences stimulatrices 
de 1’ epissage sont egalement presentes. Elies sont reconnues par des 
proteines regulatrices qui recrutent la machinerie d’epissage. Comme 
pour les proteines regulatrices de la transcription, ces proteines posse- 
dent deux types de domaines, l’un qui s’attache a 1’ ARN et l’autre qui 
s’attache a la machinerie d’epissage (Fig. 5.8). 

Epissage alternatif et localisation cellulaire 

La regulation de l’epissage altematif des ARN messagers a pour conse- 
quence principale d’accroTtre la diversite des proteines cellulaires et 
d’aboutir a la synthese de proteines differentes selon les types cellulaires 
consideres. Un meme transcrit pourra ainsi foumir deux ARNm matures 
codant pour deux proteines exergant des fonctions de liaison vis-a-vis 
d’un ligand dans deux localisations cellulaires differentes (Fig. 5.9). 

5.3 EXPRESSION DES GENES : REGULATION TRADUCTIONNELLE 

La sequence complete d’un ARNm a generalement une taille superieure 
a la partie qui sera effectivement traduite en sequence proteique. Le 
terme « cadre ouvert de lecture » ou sequence codante (voir plus 
haut) designe le segment d’ARNm qui est traduit (Fig. 5.10). Chaque 
sequence codante est delimitee par un codon de demarrage (tres 
souvent AUG) et un codon de terminaison de la traduction qui est 
1’un des trois codons d’arret, UAG, UGA ou UAA. 

La plupart des ARNm eucaryotes comportent un seul cadre ouvert 
de lecture ; ils sont de ce fait dits monocistroniques. Les ARNm pro- 
caryotes comportent frequemment plusieurs ORF (Open Reading 
Frame ou cadre ouvert de lecture) et sont dits pour cette raison poly- 
cistroniques. Ils codent generalement chez les bacteries des proteines 
impliquees dans une meme voie metabolique. Pour certains ARNm 
polycistroniques, le codon d’arret d’un ORF chevauche le codon de 
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Figure 5.9 Le transcrit primaire (pre-ARNm) peut subir un epissage alternatif. 

Les deux proteines obtenues possedent le meme domaine C-terminal code par les 
exons 3 et 4 (meme cadre de lecture) mais different dans leurs parties N-terminales 
codees respectivement par I'exon 1 ou I'exon 2. Les deuxs proteines n'ont pas la meme 
localisation cellulaire. L'une est ancree dans la membrane grace a son domaine trans- 
membranaire code par I'exon 1 etexerce une fonction receptricea I'exterieur de la cel- 
lule, I'autre est strictement cytoplasmique et ne pourra s'associer qu'a un ligand 
intracellulaire. 
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dtmarrage de l’ORF suivant dans une sequence 5’-AUGA-3’ contenant 
les deux codons. En regie generale les regions en amont 5’ du codon 
AUG et en aval 3’ du codon d’arret de l’ARNm sont cependant indis- 
pensables a la traduction. Elies sont differemment utilisees par les 
procaryotes et les eucaryotes pour le recrutement des ribosomes et des 
nombreuses proteines necessaires a la traduction. 

Les elements de structure des ARN messagers eucaryotes influengant 
la traduction comportent (Fig. 5.10) : 

> Les structures situees aux deux extremites de l’ARNm : la structure 
en 5’, constitute par la 7-methyl-guanosine triphosphate, appelte 
aussi coiffe (« capping structure ») et la structure en 3’, consti- 
tute d’une stquence additionnelle polyadtnylte ou queue polyA. 
La communication physique entre ces deux structures contraint 
F ARN qui adopte de ce fait une structure circulaire. Elle est essen- 
tielle pour l’efficacitt du dtmarrage de la traduction. 

> Les stquences internes du messager assurant pour le dtmarrage de 
la traduction une entrte des ribosomes (ou IRES) indtpendante de 
Fextrtmitt 5’ (7-mtthyl-guanosine triphosphate) du messager. 

> Les petits cadres de lecture (pORFs), situts en amont du cadre 
principal (ou ORF, « open reading frame ») reprtsentt par la stquence 
codante du gene, qui amoindrissent la traduction par avortement 
rtpttt en raison de leur taille. 


5' UTR nORF Cadre de lecture (ORF) 3' UTR Queue polyA 



Figure 5.10 Structures des ARNm influen^ant la traduction. 

L'ARNm eucaryote possede une extremite 5' protegee (CAP) ou se fixe le ribosome 
avant de balayer I'ARN jusqu'au codon de demarrage situe generalement au sein 
d'une sequence dite de Kozack stimulatrice du demarrage tout comme la queue poly- 
adenylee situee a son extremite 3'. Noter la presence de sequence interne d'entree des 
ribosomes (IRES) et de sites specifiques de liaison de proteines ou d'ARN regulateurs. 
START : region contenant le codon de demarrage ; UTR : region non traduite. 
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>- Les structures secondaires et tertiaires de l’ARNm, en forme d’epin- 
gles a cheveux ou de nceuds, qui bloquent normalement la traduction, 
mais peuvent faire partie des IRES et ainsi stimuler une traduction 
independante de l’extremite 5’. 

> Les sites de liaisons specifiques de complexes proteiques qui sont 
des determinants cruciaux de la traduction. 

La plupart de ces elements et mecanismes regulateurs sont en fait 
inhibiteurs de la traduction. Cela signifie que les ARNm d’une cellule 
eucaryote, loin d’etre systematiquement traduits, une fois transcrits et 
matures, se distribuent en deux ensembles d’inegale importance. Le 
premier, minoritaire, comporte a la fois un petit nombre d’ARNm 
activement traduits et les ARNm qui bien que non reprimes sont en 
attente de la disponibilite des facteurs de demarrage. Le deuxieme, 
comporte tous les ARNm reprimes par Fun ou F autre des mecanismes 
cites ci-dessus. 
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5.4 REGULATIONS EPIGENETIQUES DE L'EXPRESSION 
DES GENES 

L’heredite epigenetique repose sur la transmission d’une information 
qui n’est pas codee dans la sequence de F ADN bien qu’elle soit trans- 
mise de cellule mere en cellule fille et de generation en generation. 
Des donnees experimentales de plus en plus solides s’accumulent en 
faveur de F existence d’un code particulier a cette heredite. II repose- 
rait sur des modifications covalentes de l’ADN et sur un infini reper- 
toire d’ interactions etablies entre la double helice, les histones de la 
chromatine et de tres nombreuses proteines regulatrices (Fig. 5.1 1, 
voir aussi fin du chapitre 7) . 

Modifications biochimiques des histones et de FADN : 
I'epigenomique 

Les deux principaux composants biochimiques du code epigenetique 
hereditaire sont les mecanismes de methylation-demethylation de 
FADN au niveau notamment des llots CpG et les modifications des 
queues d’histones par des mecanismes d’acetylation-desacetylation et 
de methylation-demethylation. Une nouvelle discipline, I’epigenomique 
se propose d’etudier ces phenomenes epigenetiques a l’echelle des 
genomes entiers. Elle recherche notamment a identifier les sequences 
de FADN qui dirigent les modifications epigenetiques et celles qui en 
sont la cible. Une attention speciale est portee dans ces approches au 
role joue par les sequences repetees de type LINE (Long Interspersed 
Nucleic Element) et SINE (Short Intersperded Nucleic Element). Ces 
elements sont largement represents dans les genomes de vertebres, 
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Figure 5.11 Les deux principaux composants du code epigenetique de la 
chromatine. 

Lesgroupes methyl (points roses) portes par certaines bases de I'ADN (cytosine princi- 
palement) contribue par leur presence a la repression des genes. Des combinaisons de 
diverses proteines regulatrices peuvent se fixer aux queues protuberantes des histones 
et alterer I'expression de I'ADN proximal. 

notamment de mammiferes, transmis fidelement de generation en 
generation, et sont souvent mobiles dans les genomes sans que 1’on 
ait encore bien compris leurs fonctions genetiques. 

Genetique et epigenetique 
des jumeaux monozygotiques 

En raison de leur identite genetique parfaite - comme un clone compose 
de deux individus - les jumeaux monozygotiques sont depuis long- 
temps des modeles d’ etude particulierement apprecies pour tenter de 
distinguer le role respectif des genes et de l’environnement dans la 
formation des phenotypes. Une etude recente portant sur les deux 
principales modifications epigenetiques (methylation de I’ADN et 
acetylation des histones) accumulees au cours du temps par 40 paires 
de jumeaux monozygotiques, places pour certains par les hasards de la 
vie dans des environnements distincts, montre que 65 % des couples 
presentent des profils epigenomiques presque identiques, mais que 35 % 
manifestent des differences significatives. Une etonnante relation a 


Dunod - Toute reproduction non autorisee est un delit. 


5.4 • Regulations epigenetiques de I' expression des genes 


139 


ete etablie entre 1’age des jumeaux et Fetendue des differences epige- 
netiques. Celles-ci sont egalement correlees avec le temps de separa- 
tion qu’ont connu certains couples et leurs problemes de sante. Afin 
d’etablir la signification biologique de ces analyses, les empreintes 
methylees de certaines sequences ont ete soigneusement analysees. 
52 % des sequences correspondent a des regions repetees et le reste a 
des genes connus ou suspectes. Sont egalement impliques des ilots 
CpG localises dans des regions promotrices differemment methylees, 
ce qui suggere qu’un effet sur l’expression des genes s’est manifesto. 
Des analyses utilisant des microreseaux d’ADN confirment ces 
donnees. Les profils d’expression des jumeaux ages de 3 ans sont 
quasiment identiques alors que ceux des jumeaux ages de 50 ans 
different fortement. II est connu que les modifications dans F expres- 
sion des genes, dues a des marques epigenetiques accumulees au 
cours du temps, exercent une influence significative sur de nombreux 
types de maladies. II reste a savoir si les differences de profils epige- 
netiques observees chez les jumeaux monozygotiques sont le resultat 
d’une accumulation de mutations touchant le maintien ou la transmis- 
sion des marques epigenetiques ou si les facteurs environnementaux 
comme F alimentation ou la pollution ont joue un role. 

Modifications post-transcriptionnelles des transcrits 
par « editing » 

II s’agit d’un mecanisme qui, a Finstar de l’epissage, modifie la 
sequence d’un ARN apres sa transcription. La proteine qui en resulte 
est differente de celle qui est predite par la sequence du gene. 

Deux principales modalites sont connues : d’une part, la desamination 
d’une cytosine en uracile ou d’une adenine en inosine (Fig. 5.12) et 
d’autre part l’insertion ou la deletion d’uridine a l’aide d’un ARN guide. 
L’adenosine desaminase reductase (ADAR) transforme directement sur 
F ARN, l’adenine en inosine. Au moment de la traduction, l’inosine 
sera reconnue comme une guanine et la sequence de la proteine en sera 
modifiee ainsi que sa fonction. 

Empreintes parentales 

Chez les organismes diploides, les cellules somatiques possedent deux 
copies de genome et chaque gene autosomal est done represente par 
deux copies (deux alleles), chacune heritee de Fun des deux parents 
au moment de la fecondation. Pour la plupart des genes autosomaux, 
les deux alleles generalement s’expriment. Cependant, certains genes 
(< 1 %) sont porteurs d’une empreinte parentale qui determine 
lequel des deux alleles pourra s’ exprimer (Fig. 5.13). Par exemple le 
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Figure 5.12 Mecanisme de l'« editing » de I'adenine en inosine (A— >1) au niveau 
du pre-ARNm.Trois stades de Taction de I'ADAR (Adenosine deaminase reductase) 
sur le transcrit de I'ARN polymerase sont presentes. 

(a) Le debut du transcrit contient une adenosine modifiable au sein du codon CAG 
correspondant a la glutamine. La poursuite de la transcription devoile une sequence 
intronique complementaire contenant un site d'editing. Un appariement de bases 
s'etablit et forme une helice avec la region codante contenant le codon CAG. L'enzyme 
ADAR se fixe au duplex et desamine A en I ce qui a pour consequence de donner un 
codon CIG (equivalent traductionnel de CGG). La glutamine sera remplacee par une 
arginine. Le duplex est ensuite dissocie par une helicase et I'intron elimine par le 
mecanisme habituel. 

(b) Les differentes positions au long d'une molecule d'ARN ou les adenosines peuvent 
subir un « editing ». Ces positions ne se rencontrent pas seulement dans les regions 
codantes des transcrits (2, 7) mais aussi dans les regions 3' et 5' UTR (1,8), dans les sites 
d'epissage en bordures d'introns et d'exons (3, 5) et au site de branchement (4,6). Un 
« editing » peut egalement modifier un codon stop (7). 
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gene codant IGF2 (Insulin-like growth factor) s’ exprime uniquement 
via 1’ allele paternel. L’addition d’une empreinte est un processus 
dynamique qui varie a chaque generation. L’empreinte peut s’effacer 
et se restaurer ce qui est en accord avec l’origine epigenetique 
(methylation de l’ADN et modifications des histones) du processus. 


Allele 1 




ADN 



Methylation de 
I’ADN au niveau 
des Tlots CpG 



Figure 5.13 Caracteristiques des genes porteurs d'empreintes. 

La figure presente schematiquement une paire d'alleles porteurs d'empreintes au 
niveau des ilots CpG et de sequences repetees (fleches). Les agrandissements souli- 
gnent les changements observes selon les alleles : condensation des nudeosomes 
consecutive a des desacetylations d'histones et des methylations de I' ADN (allele 1 ) ; 
ouverture de I a chromatine suite a une acetylation des histones et une demethylation 
de I' ADN (allele 2). L'aptitude a la transcription de Tallele 2 est indiquee par la fixation 
et Taction d'un complexe de transcription. 
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Dans la lignee germinale, l’empreinte est effacee puis elle est retablie 
suivant le sexe de l’individu. Au cows de la formation des spermato- 
zoi'des, une empreinte paternelle s’etablit, alors que dans V ovule une 
autre empreinte maternelle s’installe. Le processus d’effacement puis 
de reprogrammation s’avere indispensable afin que 1’ empreinte soit 
conforme au sexe de l’individu (voir aussi fin du chapitre 7). Les 
genes porteurs d’empreintes sont generalement regroupes en clusters 
et partagent des elements regulateurs communs, comme des ARN 
non codants et des regions differentiellement methylees. Ces demieres 
sont generalement riches en G + C, la cytosine etant souvent methylee 
sur Tune des copies mais pas sur 1’ autre. 

Les processus de mise en place des empreintes sont specifiques aux 
mammiferes placentaires et ils jouent un role dans le developpement 
et la croissance embryonaires. Certains genes de ce type participent 
au developpement postnatal (allaitement et metabolisme). Plusieurs 
phenotypes majeurs dependent des modalites de transmission ou de 
maintien d’empreintes parentales. Ainsi, a titre d’exemple, plusieurs 
maladies genetiques humaines sont associees a des empreintes anor- 
males du locus 15ql 1 (la bande chromosomique 1 1 est situee sur le bras 
long du chromosome 15). Cette region porte une empreinte epigene- 
tique differente sur les chromosomes paternel et maternel, les deux 
empreintes etant cependant indispensables pour le developpement 
normal de l’individu. Si l’une des empreintes n’est pas correctement 
transmise, en raison d’une deletion de la region touchant l’un des 
chromosomes ou si les deux chromosomes proviennent d’un seul des 
deux parents (disomie uniparentale), diverses maladies genetiques 
graves peuvent survenir. Ainsi, l’absence d’une empreinte paternelle 
se manifeste par le syndrome de Prader-Willi, caracterise par une 
hypotonie, une obesite et un hypogonadisme ; 1’ absence de 1’ empreinte 
maternelle se manifeste par le syndrome d’Angelman caracterise par 
une epilepsie, des tremblements et une expression faciale figee dans un 
sourire. 

A propos de I'origine des empreintes parentales 

Deux theories ont ete proposees pour expliquer l’origine de ces 
mecanismes : la theorie de la parente et la theorie de la co-adaptation. 

La premiere, egalement connue comme l’hypothese du conflit 
parental, repose sur X existence d’un conflit entre les « interets » des 
genes maternels et paternels chez le foetus ou le nouveau-ne lorsque ces 
derniers dependent des ressources de la mere pour leur nutrition. Cette 
hypothese repose sur le fait que les meres de mammiferes placentaires 
peuvent porter et donner naissance a des fils/filles issus de plusieurs 
peres. Alors qu’une mere est reliee genetiquement a tous ses fils/filles 
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de fagon quasi identique, chacun des peres n’est relie qu’aux descen- 
dants qu’il a engendres. L’hypothese postule que cette difference dans 
la parente engendre des « interets » differents pour le devenir des 
genomes matemels et patemels des descendants. Du cote paternel, il 
serait avantageux qu’un maximum de ressources matemelles soit 
consacre, pour leur devenir, aux genes patemels du descendant, sans 
egard aux consequences qui peuvent en resulter pour la mere elle- 
meme ou ses autres descendants. Au contraire, du cote maternel, il 
serait avantageux pour le devenir des genes maternels du fils ou de la 
fille que les ressources maternelles soient equitablement partagees de 
telle sorte que la mere ait la meilleure chance de continuer a assurer sa 
descendance. Cette theorie s’accorde avec les donnees montrant que 
de nombreux genes sous empreinte paternelle stimulent la croissance, 
alors que de nombreux autres, sous empreinte maternelle, la repri- 
ment. Un constat similaire mais inverse peut etre fait a propos des 
genes intervenant dans le comportement social et les soins maternels. 

La theorie de la co-adaptation propose de son cote que les genes 
sous empreinte parentale agiraient de concert pour optimiser le deve- 
loppement foetal, la sante de la mere et la nutrition des descendants. 
Cette theorie est confortee par le fait que les principaux genes sous 
empreinte paternelle s’expriment a la fois dans le placenta et 1’ hypo- 
thalamus. Au cours du developpement d’un mammifere, V ensemble 
complexe des interactions se produisant entre le foetus, le placenta et 
F hypothalamus maternel, influencent la croissance du foetus lui- 
meme, le developpement de son cerveau, le renouvellement des 
ressources maternelles, aux stades prenatal et postnatal, ainsi que les 
soins maternels postnatals. La regulation de ces fonctions par les 
empreintes genomiques serait due a une co-adaptation descendant- 
parent, grace a une selection de genes co-exprimes dans le placenta et 
1’ hypothalamus de la mere. Le gene sous empreinte paternelle Peg3 
(Paternally expressed gene 3) qui code un important facteur de trans- 
cription, constitue un exemple cle de cette theorie. 

5.5 LES RESEAUX DE REGULATION DE L'EXPRESSION DES GENES 

Analyse de I'expression a I'echelle des genomes : 
les outils de la genomique 

La genomique etudie la totalite du genome d’un organisme a la diffe- 
rence de la genetique moleculaire qui s’ attache plus specialement a 
1’ etude de genes particuliers en accordant une attention a leurs divers 
roles et fonctions. L’une de ses demarches principales consiste a etablir 
la sequence complete des genomes etudies (genomique structurale) et a 
proceder a 1’ analyse de I’expression dans sa globalite (genomique 
fonctionnelle) en fonction notamment les conditions environnementales. 
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Figure 5.14 Representation schematique de la demarche experimentale condui- 
sant a ^identification, a I'echelle du genome de la levure, des genes dont I'expression 
est associee a un etat physiologique (a un phenotype) particulier. 

Les ARNm poly A, extraits des levures placees dans des conditions differentes de culture 
ou soumises a un stress biochimique ou physique, sont retrotranscrits en ADN et marques 
par des fluorochromes differents (cyanines 3 et 5). Ils sont ensuite hybrides sur un 
microreseau de cibles ADN representatives des 6 200 genes de la levure. L'analyse des 
fluorescences de chaque spot et le traitement informatique des donnees identifient 
les genes dont I'expression varie en relation avec les conditions imposees initialement 
aux levures. En rouge, dans I'echantillon teste ; en noir dans I'echantillon de reference ; 
en rose, expression identique dans les deux echantillons. 


Figure 5.1 5 Representation schematique de la demarche experimentale condui- 
sant a I'identification, a I'echelle du genome de la levure, des sequences ADN liant 
des proteines regulatrices de genes dont I'expression est associee a un etat 
physiologique (a un phenotype) particulier. > 
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*• Site de fixation 


Les sequences ADN sont obtenues par une technique d'immunoprecipitation de I'ADN 
chromatinien apres que la fixation des proteines de liaison a I'ADN ait ete rendue 
irreversible par « crosslinking » a la formaldehyde. Apres addition d'adaptateurs et 
marquage fluorescent, les sequences d'interet et les sequences temoins sont hybridees 
et analysees grace a un microreseau d'ADN representatif des regions intergeniques 
(regulatrices) du genome de levure. La fleche rouge signale un « spot » identifiant une 
sequence ADN ayant liee une proteine regulatrice (inhibitrice ou stimulatrice de 
I'expression de genes). Cette proteine est presente dans I'echantillon enrichi par 
immunoprecipitation (IP). LM-PCR : Ligation Mediated-PCR. 
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Les outils privileges dans ces demarches reposent sur les analyses a haut 
debit, autorisees par les nouvelles techniques de sequengage (voir Mini- 
manuel Biologie moleculaire) associees a la bioinformatique et a un 
moindre degre par les microreseaux d’ ADN (puces a ADN). Des appro- 
ches similaires sont pratiquees egalement avec 1’ ensemble des transcrits 
(Iranscriptome) d’une cellule ou d’un organisme, c’est la transcripto- 
mique, ou avec les proteines (proteome), c’est la proteomique. 

Aujourd’hui, des milliers de genomes viraux, bacteriens et euca- 
ryotes sont sequences et leur nombre s’accroTt sans cesse. Beaucoup 
de ces genomes appartiennent a des organismes modeles (levure, 
drosophile, nematode, poisson zebre, arabette, ble, riz, souris, rat, 
bovin, chimpanze, homme) dont l’interet est grand a la fois sur les 
plans fondamental et applique. 

Une branche tres active de la genomique s’interesse tout particulie- 
rement a la comparaison des genomes et a leur evolution. Les donnees 
qui en resultent renouvellent et confirment a la fois les idees evolution- 
nistes proposees initialement par Darwin. Les relations genomiques 
entre des organismes vivants peuvent se resumer par une expression 
devenue celebre chez l’homme : « tous parents et tous differents » qui 
integre l’idee d’une commune origine (tous parents) et celle que muta- 
tion et selection ont cree au fil du temps beaucoup de differences (tous 
differents). De nombreuses sequences genomiques sont conservees 
entre les especes temoignant sans doute a la fois de l’avantage selectif 
qu’elles represented et de leur importance pour le fonctionnement du 
vivant. Mais toutes sont loin de coder des proteines, beaucoup sont 
transcrites en ARN non codants, ce qui a pour signification que le 
fonctionnement des organismes vivants semble etrangement dependre 
dans une mesure aux limites encore inconnues de nombreux ARN 
dotes de fonctions regulatrices (voir ENCODE ). 

Les donnees foumies par les etudes de l’expression des genomes a 
grande echelle repose sur des approches utilisant les puces a ADN 
(Fig. 5.14 et Fig. 5.15). L’une des plus courantes aujourd’hui consiste a 
analyser de fagon differentielle 1’ expression des genes entre deux etats 
physiologiques fonctionnels et a identifier ainsi ceux qui sont associes a 
la formation d’un phenotype particulier, qu’il soit biochimique ou 
morphologique (Fig. 5.14). On notera que ce type d’analyse ne prend 
en compte pour l’instant que les genes dont les transcrits (ARNm poly- 
adenyles) sont traduits en proteines. 

Un autre type d’analyse proche du premier consiste a identifier les 
sequences genomiques qui sont des sites de liaison pour les proteines 
exergant une fonction regulatrice. Bien que la probabilite soit faible que 
ces sequences se trouvent a l’interieur de genes, la demarche est cons- 
truite de telle maniere qu’aucune eventualite ne soit exclue (Fig. 5.15). 


Dunod - Toute reproduction non autorisec cst un delit. 


5.5 • Les reseaux de regulation de I'expression des genes 


147 


Les notions de hierarchie et de reseaux de genes 

Ces notions peuvent etre apprehendees experimentalement par la mesure 
des interactions proteiques alliee aux donnees fournies par des « puces 
ADN » analysant le niveau des transcrits (Fig. 5.16). Cette demarche 
suppose que Ton dispose de donnees controlees et fiables. A partir du 
reseau maitre qui donne Fensemble des interactions etablies entre les 
proteines A a F (en haut a gauche) certaines proteines peuvent etre 
exclues selon les conditions cellulaires ou environnementales retenues 
(1 a 3) si V on considere la perte d’ expression de leurs genes corres- 
pondants, constatee a l’aide d’une puce ADN (en haut a droite). On peut 
ainsi etablir des sous-reseaux d’ interactions proteiques specifiques 
selon les conditions particulieres retenues par l’experimentateur. 
Ainsi, par une serie d’ experiences utilisant des puces a ADN, faciles 
d’acces aujourd’hui, on peut done selon le type cellulaire ou les stades 
de developpement consideres, etablir une succession de reseaux 
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Figure 5.16 Differents sous-reseaux d'interactions proteiques specifiques de divers 
stades du developpement d'un organisme ou d'une cellule peuvent se deduire 
d'un reseau proteique maitre et de donnees acquises a I'aide de puces a ADN. 
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proteiques et geniques qui mettront en evidence les evolutions et les 
transitions adoptees par les reseaux de genes qui controlent les processus 
developpementaux. 

De 1’ ensemble de ces demarches se degage le concept considerant que 
les organismes fonctionnent des la premiere cellule-ceuf et les premiers 
stades de developpement, sur la base de reseaux de genes qui assureraient 
egalement leur adaptation permanente aux conditions environnemen- 
tales. Differentes approches statistiques sont necessaires pour degager les 
relations regulatrices specifiques (inhibitrices ou stimulatrices) existant 
entre les composants du reseau (Fig. 5.17). De telles approches ont 
abouti a l’idee qu’a Finverse d’une organisation de type hierarchique 
avec des genes « architectes » et des genes « constructeurs » ou « reali- 
sateurs » qui, atitre d’exemple, s’etait degage des etudes genetiques sur 
la formation de l’ceil, le fonctionnement du genome des organismes 
vivants s’apparente a un fonctionnement en reseaux de reseaux, dont 
la complexity est encore tres loin d’etre apprehendee. 


Activateurs 

transcriptionnels 


Stimuli externes 

i 

Voies de serialisation 

OtOOOOff 



Genes cibles 



Figure 5.1 7 Schema tres simplifie d'un modele de reseau regulateur de I'expression 
de genes. 

Les cercles colores represented des activateurs transcriptionnels. Les ovales rectangles 
represented les genes qui au sein du genome sont les cibles de ces activateurs. La 
couleur du rectangle indique quels sont les activateurs qui regulent I'expression du 
gene en reponse a un stimulus environnemental. Les fleches etablissent la relation 
entre chaque activateur transcriptionnel et son gene cible. Un tel modele peut etre 
con^u comme un reseau individuel d'interactions geniques ou mieux encore comme 
une collection de reseaux regulateurs disposes eux-memes en reseaux, comme le 
suggere la fleche situee la plus a droite du schema. 
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Figure 5.18 Schema recapitulatif specifiant les flux d'information allant du genome 
au phenotype et indiquant les types de donnees utilisees pour decrire les processus 
biologiques integres. 

De haut en bas, on trouve successivement, I'ADN (genomique) transcrit d'abord en 
ARN (transcriptomique) et traduit ensuite en proteines (proteomique) qui elles-memes 
peuvent catalyser des reactions qui agissent ou donnent naissance a des metabolites 
(metabolomique) parmi lesquels on trouve des glycoproteines et des oligosaccharides 
(glycomique) et differents lipides (lipidomique). Beaucoup de ces composants peuvent 
etre marques et localises au sein de la cellule ou de I'organisme (localisomique). Les 
processus responsables de la formation et de la modification des composants sont 
bases habituellement sur des interactions moleculaires (interactions entre proteines 
et ADN par exemple pour la transcription, ou entre proteines dans la traduction et les 
reactions enzymatiques). Finalement, les voies metaboliques comportent des reseaux 
integres, des cartes de flux (fluoxomique) qui dictent le phenotype cellulaire ou de 
I'organisme (phenomique). 
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Autres « omiques » 

Les termes en « ome » (genome, transcriptome, proteome, metabo- 
lome, lipidome, glycome, etc.) et « omiques » derivent du suffixe 
« ome » dont 1’ utilisation a ete generalisee pour designer des champs 
nouveaux de la connaissance et de la recherche en biologie. Pour 
certains (genome et genomique par exemple) ces termes sont reelle- 
ment fondes, ils sont plutot speculates pour d’ autres. Le terme en 
« ome » designe une collection d’objets (les genes par exemple) dont 
il s’agit d’etudier la nature, l’origine, la fonction, etc., alors que le 
terme en « omique », qui possede a l’origine le statut d’un adjectif, 
designe maintenant les sciences correspondant a ces objets avec leurs 
concepts, hypotheses et speculations. Compte tenu qu’il s’agit dans 
tous les cas d’acquerir et de manipuler de grands ensembles de 
donnees parfois complexes, l’intervention de l’informatique est une 
constante de ces champs nouveaux de la biologie. 

Les sciences « omiques » se proposent de foumir des descriptions 
detaillees de tous les composants et interactions qui prennent place dans 
une cellule ou un organisme vivant. Ces donnees peuvent etre classifies 
en trois categories : les composants, les interactions, et les donnees rela- 
tives aux etats fonctionnels (Fig. 5.18). Les donnees relatives aux compo- 
sants detaillent le contenu moleculaire de la cellule ou du systeme etudie ; 
les donnees relatives aux interactions specifient les liens existant entre les 
composants moleculaires et les donnees relatives aux etats fonctionnels 
foumissent une lecture integree de tous les types de donnees « omiques » 
en revelant un phenotype global de la cellule ou du systeme. 

5.6 LA GENOMIQUE ENSANTE HUM AINE 
ET POUR LA SELECTION ANIMALE 

La genomique en sante humaine 

Decouvrir les variations genetiques hereditaires qui sont a l’origine 
des pathologies humaines, constitue aujourd’hui Fun des defis scien- 
tifiques majeurs de la biologie et de la genetique. Le sequengage 
complet en 2001 du genome humain a represente, a cet egard, un 
progres considerable, mais l’exploit doit etre attenue par le fait qu’il 
s’agissait alors de la seule sequence genomique haploi'de. Aucune 
indication ne mettait en evidence la presence des variations de 
sequence qui sont, chez les humains comme chez tous les autres etres 
vivants, a l’origine pour l’essentiel des nombreuses differences 
phenotypiques. Depuis lors, de plus en plus d’etudes ont ete conduites 
pour decouvrir les liens de causalite existant entre les variations de la 
sequence genomique et la susceptibilite des humains vis-a-vis des 
maladies qui les affectent. 
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Les variations structurales du genome humain 

Ces etudes conduisent a distinguer parmi les polymorphismes geneti- 
ques humains identifies, ceux dits « communs » presentant une 
frequence allelique d’au moins 1 % au sein de la population et ceux 
dits « rares » dont la frequence allelique est inferieure a 1 %. D’un 
point de vue structural, on peut distinguer deux types de variations 
genetiques : les SNP (pour Single Nucleotide Polymorphism ) et les 
polymorphismes dits structuraux (Tableau 5.1). 

Tableau 5.1 Les differentes classes de polymorphismes genetiques humains. 


Type 

de variation 

Exemple 

SNP (polymor- 
phismed'un 
seul nucleotide) 

ATGGCCTTTACCCCGACGATCAGGAT 

ATGGCCTTTACTCCGACGATCAGGAT 

Indel (inser- 
tion/deletion) 

ATGGCCTTTACCCCGACGATCAGGAT 
ATGGCCTTTACCCC GATCAGGAT 

Substitutions 
de blocs 

ATGGCCTTTACCCCGACGATCAGGAT 

ATGGCCTTTAGAGTGACGATCAGGAT 

Inversion 

ATGGCCTTTACCCCGACGATCAGGAT 

ATGGCCTTCGTCGGGGTAATCAGGAT 

Variation 
du nombre 
de copies 

ATGGC CTTT AGCCTTT AC C C C GACG ATC AGG AT 
ATGGCCTTTA C C C C GACG ATC AGG AT 


Les SNP sont des variations de sequences ADN ou un simple nucleotide (A,T,G ou C) est 
modifie. Les autres variations dites structurelles comprennent : les « Indel » (pour insertion- 
deletion) qui se rencontrent lorsque une ou quelques bases sont presentes dans un 
genome et absentes dans les autres. Composees generalement de quelques bases elles 
peuvent parfois aller jusqu'a 80 kb.Les substitutions de blocs designent des sequences de 
nucleotides adjacents qui varient entre deux genomes. Les inversions sont observees lors- 
que I'ordre des paires de bases s'inverse dans une section definie d'un chromosome (on 
connait une inversion d'une longueur de 900 kb dans le chromosome 1 7 humain, chez 
20 % des individus ayant un ancetre nord europeen). Les variations du nombre de copies 
(ou CNV pour Copy Number Variation) designent des sequences identiques ou presque qui 
sont repetees chez certains individus mais pas chez d'autres. Le nombre de repetitions 
varie et ces dernieres peuvent atteindre parfois une taille elevee de I'ordre de 2 Mb. 


L’origine des polymorphismes genetiques doit etre recherchee dans 
les evenements aleatoires non corriges survenant lors de la duplica- 
tion de 1’ ADN et de la recombinaison chromosomique concomitante 
de la mitose et de la meiose (voir chapitre 2). La plupart des variations 
genetiques, au sein de la population humaine sont ainsi dues au hasard 
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de la reproduction et ne contribuent probablement pas a la diversite 
phenoty pique. On dit qu’elles sont neutres. Cependant pour une mino- 
rite d’entre elles, ces variations peuvent etre a l’origine d’une modifi- 
cation de phenotype. C’est notamment le cas lorsqu’un SNP se situe 
dans une sequence codante ou a proximite d’un element regulateur. 
Ainsi, lorsqu’un polymorphisme modifie un gene, ou une structure 
genetique, implique dans une pathologie, celui-ci peut participer a la 
susceptibilite ou a la resistance d’un individu a cette pathologie. 

Les SNP 

Ils sont les plus frequents et Ton estime a pres de 11 millions le 
nombre de SNP total au sein du genome humain (7 millions ayant une 
frequence superieure a 5 %, le reste une frequence comprise entre 1 et 
5 %). L’analyse de ces SNP au sein des premiers genomes individuels 
entierement sequences montre que la plupart d’entre eux sont reperto- 
ries dans la base de donnees generale des SNP ( Tableau 5.2). II a ete 
montre que les alleles des SNP presents dans une meme region geno- 
mique sont souvent correles les uns aux autres. Cette correlation, 
designee par le terme de « desequilibre de liaison », varie a la fois de 
fa^on complexe et imprevisible, au sein des genomes et entre les 
differentes populations. 

Tableau 5.2 Polymorphismes de type SNP identifies dans quatre genomes remarquables. 


Genome 

Nbde SNP 

% de presence dans la 
base generale des SNP 

J. Craig Venter 

3 213 401 

91,0% 

James D. Watson 

3 322 093 

81,7% 

Chinoisethnie Han 

3 074097 

86,4% 

Africain ethnie Yoruban 

4139196 

73, 6 % 


C. Venter et J. Watson sont deux celebres scientifiques parmi les premiers humains dont 
le genome a ete entierement sequence. Ils sont de type caucasien. Les deux autres indi- 
vidus sont des anonymes de types asiatique et africain.Les trois premiers genomes pos- 
sedent un nombre similaire de SNP bien represents dans la base actuelle de donnees 
des SNP humains. Au total 5, 2 millions de SNP differents sont identifies entre les trois 
genomes. Lorsqu'un plus grand nombre de genomes individuels sera sequence, 
1 1 millions de SNP devraient etre identifies. Le genome africain possede un plus grand 
nombre de SNP, plutot nouveaux vis-a-vis de la base de donnees. Cependant dans 
I'ensemble, il apparait que lorsque deux genomes humains sont compares, la majorite 
des bases qui different appartient a la categorie des variations communes. La base de 
donnee generale (dbSNP) est accessible librement a I'adresse suivante: http:// 
www.ncbi.nlm.nih.gov/projects/SNP/ 
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Les polymorphismes structuraux 

Pris dans leur ensemble, les polymorphismes structuraux represented 
entre 9 et 25 Mb (soit jusqu’a pres de 1 % du genome) ce qui suggere 
un role tres significatif de ces variations genetiques en matiere 
d’ evolution du genome. ( Tableau 5.3). 

Tableau 5.3 Polymorphismes structuraux identifies dans le genome de Craig Venter. 


Polymorphismes structuraux 

Nombre 

Longueur (en pb) 

Substitution de bloc 

55 823 

2-206 

Indels (heterozygotes) 

851 575 

1 -82 711 

Inversions 

90 

7-670345 

Nombre de copies 

62 

8 855 - 1 925 949 


Le genome d'un individu caucasien (C. Venter) contient au total environ 4,1 millions de 
variations genetiques dont 22 % sont des polymorphismes structuraux representant 
74 % de toutes les bases variantes.Cependant,de nombreux polymorphismes structu- 
raux restent vraisemblablement a decouvrir avec I'augmentation du nombre de geno- 
mes individuels sequences. Comme pour les SNP, on s'attend a ce que la majorite de 
ces variations soit commune a beaucoup d'humains. 


Contribution des divers polymorphismes genetiques 
aux phenotypes chez I'homme 

O 

Chez les humains des centaines de phenotypes complexes determi- 
nent Failure exterieure, le comportement, mais aussi la propension a 
developper certaines maladies. On designe sous le terme de « trait 
complexe » le phenotype qui, selon les individus examines, presente 
divers degres de variation anatomique, physiologique ou biochimique 
formant ainsi une sorte d’echelle de distribution continue. On consi- 
dere que de tels phenotypes sont les produits de Faction independante 
de nombreux genes (ou mieux de leurs alleles), mais aussi de facteurs 
environnementaux ainsi que de subtiles interactions entre genes 
(alleles) et facteurs de Fenvironnement. Pres de 4 millions de poly- 
morphismes genetiques sont presents en moyenne simultanement 
chez un individu ( Tableaux 5.2 et 5.3). La difficult^ consiste a etablir 
lesquels parmi ces polymorphismes, s’averent responsables de la 
transmission hereditaire des phenotypes, notamment ceux qui predis- 
posent a developper une pathologie (cancers, maladies cardio-vascu- 
laires, maladies neurodegeneratives, etc.). Deux theories opposees 
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(theories 1 et 2, voir Fexemple ci-dessous) sont alternativement 
proposees a ce sujet. La premiere affirme que les traits complexes 
sont principalement dus a un grand nombre de polymorphismes 
communs, chacun d’entre eux etant porteur d’un effet modeste. A 
1’ oppose, la seconde propose que les traits complexes resultent d’une 
somme d’effets majeurs portes par un petit nombre de polymor- 
phismes rares. 


Les etudes dissociations entre phenotypes et genotypes. 

Avec la disponibilite du sequengage complet du genome humain et la 
decouverte de millions de SNP au sein des genomes, de nouveaux 
outils de genotypage ont ete rapidement developpes. Ces outils a haut- 
debit, appelees « puces ADN », permettent de genotyper simultane- 
ment plusieurs centaines de milliers, voire plusieurs millions de SNP 
repartis sur l’ensemble du genome. La disponibilite de ces nouvelles 
ressources a rendu possible la recherche, a 1’ echelle du genome 
dans son ensemble, d’une association statistique entre un phenotype 
(par exemple une pathologie) et certains polymorphismes genetiques 
communs ; cette approche est appelee etude dissociation a grande 
echelle (GWAS, Genome-Wide Association Studies). 

D’une maniere generate, ces etudes dissociation a grande echelle 
exploitent les differences de polymorphismes genetiques qui sont 
presents chez un grand nombre d’individus, souvent plusieurs milliers, 
atteints par une pathologie (les cas) comparativement a ceux presents 
dans un nombre similaire d’individus sains (les controles). On parle 
d’etudes dissociation « cas-controles » ou « cas-temoins ». L’objectif 
ici est de rechercher s’il existe certains polymorphismes pouvant etre 
statistiquement associes a la maladie etudiee, et influencer la suscep- 
tibility ou la resistance d’un individu au developpement de cette 
pathologie. La majorite des polymorphismes mis en evidence par ces 
etudes dissociations a grande echelle ne se sont pas reveles etre des 
mutations « causales » de la maladie, et n’expliquent generalement 
qu’une petite partie de la maladie etudiee (voir exemple ci-dessous). 
Ce type d’ etude reste cependant tres utile car elle permet de cibler 
des regions du genome associees a une pathologie et permet de 
restreindre ainsi les regions a explorer a la recherche de genes candi- 
dats et de mutations causales. Les SNP identifies jouent alors un role 
de marqueurs moleculaires. 

Ainsi, si plusieurs SNP participant a une meme voie de signalisa- 
tion sont identifies, il est vraisemblable que cette voie de signalisation 
participe au developpement de la maladie. De meme si plusieurs 
pathologies sont statistiquement associees a un locus particulier, cela 
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suggere une base genetique commune a ces maladies. Plusieurs SNP 
d’un locus du chromosome 8 ont ete associes au cancer de la prostate, 
du colon et du sein, suggerant que ce locus est implique dans le 
processus de carcinogenese. Des etudes supplementaires ont permis 
de confirmer ces resultats et d’ identifier la mutation causale, situee 
dans un stimulateur de la transcription. 

Outre une meilleure comprehension des bases moleculaires et des 
genes impliques dans la resistance ou la susceptibilite a certaines 
maladies, les resultats de ces etudes rendent possible le testage 
genetique. Ainsi il devient possible pour un patient de connaitre le 
risque (relatif) qu’il presente vis-a-vis d’une pathologie ou encore 
de pouvoir recevoir une information personnalisee sur la reponse de 
son organisme a un compose pharmaceutique. Cette derniere appli- 
cation, appelee pharmacogenomique, est un enjeu important en 
terme de sante humaine. A titre d’exemple, des etudes dissocia- 
tions ont permis de montrer que des polymorphismes du gene 
CYP2C9 sont associes au metabolisme de la warfarine, un anticoa- 
gulant utilise pour prevenir la formation de caillots dans les vais- 
seaux sanguins. En fonction de la forme allelique qu’ils portent, 
certains patients vont assimiler plus ou moins rapidement ce 
compose, ce qui risque d’engendrer une hemorragie ; la connais- 
sance de leurs variations genetiques permettra done de personnaliser 
la dose de warfarine a donner dans les traitements afin d’e viter ces 
effets secondaires. 

Polymorphismes genetiques du diabete de type 2 : un exemple 
illustrant les deux theories a propos des traits complexes 

Au total, dix-huit polymorphismes genetiques augmentant le risque 
de developper un diabete de type 2 chez des individus caucasiens ont 
ete mis en evidence au cours d’etudes dissociation a grande echelle. 
Si quatre d’entre eux avaient deja ete suspectes au cours d’etudes 
ciblant des genes candidats, les quatorze autres SNP n ’avaient jamais 
ete identifies dans la susceptibilite genetique a cette pathologie, ce qui 
a permis de cibler de nouveaux genes, et de nouvelles voies de signa- 
lisation jusqu’alors ignorees. A titre d’exemple, 1’ identification d’un 
polymorphisme a l’interieur d’un recepteur a la melatonine 
(. MTNR1B ) a permis de montrer que la voie de signalisation contro- 
lant le cycle circadien joue aussi un role dans le diabete de type 2. 

Classiquement, la force de 1’ association calculee lors d’etudes de 
type « cas-temoins » est mesuree par les odds ratios ; cette notion se 
definit par le rapport des probabilites qu’un polymorphisme genetique 
existant dans la population de patients atteints soit egalement present 
dans la population controle. Si Yodds ratio est significativement supe- 
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rieur a un, alors le polymorphisme est associe a la maladie. Dans le 
cas du diabete de type 2, les frequences alleliques minoritaires (MAF) 
et les odds ratios calcules pour les 1 8 SNP intervenant dans 
1’ augmentation du risque, sont similaires aux valeurs obtenues lors 
d’ etudes dissociations conduites sur d’autres maladies. Les MAF 
s’echelonnent de 0,073 a 0,50 et les odds ratios vont de 1,05 a 1,15 
sauf pour le gene TCF7L2 qui possede un odds ratio de 1,37. 

Au total, ces 18 polymorphismes expliquent moins de 4 % de la 
part totale du phenotype, et une faible fraction de son heritabilite. 
Ceci a pour consequence qu’il reste pour cette pathologie de 
nombreux genes a decouvrir. Si Ton suppose que les polymorphismes 
genetiques encore inconnus presentent des MAF et des odds ratios 
similaires a ceux deja identifies et une heritabilite de 40 %, il resterait 
plus de 800 polymorphismes genetiques a decouvrir (theorie 1) ! Si, 
au contraire, on considere qu’il s’agit de mutations rares, avec des 
MAF 10 fois plus petites que celles deja identifiees (done s’echelon- 
nant de 0, 0073 a 0,05) et des odds ratios 10 fois plus grands (de 1 ,63 
a 4,05) alors environ 85 nouveaux polymorphismes devraient etre 
impliques dans le diabete de type 2 (theorie 2). 

Polymorphismes genetiques de type SNP et longevite humaine 

Dans les pays industrialises, une personne sur 6 000 est centenaire, et 
ceux que Ton appelle les supercentenaires - ay ant plus de 110 ans - 
represented un individu sur 7 millions. II faut noter que 90 % des 
centenaires n’ont pas de handicap sur le plan de la sante avant l’age de 
93 ans. Dans une etude portant sur 1’ analyse complete du genome de 
1 055 centenaires comparativement a 1 267 sujets controles, des cher- 
cheurs ont bad un modele predictif prenant en compte 150 SNP. II en 
ressort que lorsque Ton soumet les informations genetiques (e’est-a- 
dire les genotypes des 1 50 SNP) d’un individu a ce modele mathema- 
tique, il est possible de determiner correctement dans 77 % des cas sa 
predisposition a devenir centenaire, ce qui atteste fortement du carac- 
tere hereditaire de la longevite. Cependant la presence de certains 
facteurs de risque (cancer, maladies cardio-vasculaires, etc....) amene 
a moduler selon des groupes de risques les voies permettant 
d’atteindre cette extreme longevite. La surprise vient du fait que la 
presence de polymorphismes genetiques associes a des maladies ne 
met pas en evidence de difference marquee entre les centenaires et les 
sujets controles. Cela signifie que ce n’est pas l’absence de predisposi- 
tion pour des maladies qui fait vivre longtemps mais bien le fait d’etre 
porteurs de mutations favorisant la longevite. Cela implique aussi que 
si Ton veut calculer le risque de developper une maladie, il ne faut pas 
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seulement s’appuyer sur la presence de polymorphismes genetiques 
qui lui sont associes mais tenir compte du patrimoine genetique global. 

La genomique pour la selection animale 

Contrairement a ce que Ton observe en matiere de sante humaine ou 
les informations tirees de la connaissance du genome humain sont, 
malgre de solides espoirs, encore peu exploitees, la genomique animale 
va modifier rapidement et fortement les pratiques de l’elevage. 

Ainsi, avec l’objectif de generaliser une selection genomique des 
bovins domestiques devant se substituer a terme a la selection pheno- 
typique actuellement la plus repandue, le sequengage de l’ADN de 
1 000 bovins appartenant a differentes races a ete entrepris par divers 
laboratoires et institutions specialises dans les etudes a grande echelle 
des genomes animaux. Les premieres donnees obtenues en 2014 sur 
quelques centaines d’ animaux (dont les males fondateurs) apparte- 
nant a quatre races (Holstein, Fleckvieh, Jersey, Angus) concernent au 
total des dizaines de millions de mutations ponctuelles de type SNP 
(Single Nucleotide Polymorphism ) et d’insertions/deletions (indels) 
dont pres de 80 % n’etaient pas jusqu’ici connues. 

Depuis de nombreuses annees la selection des males d’elites, 
destines a la reproduction par insemination artificielle, particuliere- 
ment en secteur laitier, s’ effectual grace a une longue (6-7 ans) et 
couteuse (~ 25 000 €/animal) procedure de tests phenotypiques sur 
descendance. En l’espace de quelques annees, a l’aide de puces a ADN 
permettant de tester des dizaines de milliers de SNP bovins, plus de 
750 000 animaux ont ete genotypes. Grace a cette information geno- 
typique associee a la mesure de divers traits phenotypiques d’interet, 
des equations de prediction de la valeur genetique ont pu etre etablies, 
selon une demarche qualifiee de « selection genomique ». Grace a 
1’ augmentation des demandes, le cout d’une telle selection est devenu 
competitif (< 1 00 €/animal) et 1’ application des techniques dites 
d’imputation, favorisee par le projet 1 000 genomes (Figure 5.19), 
permettra a tous les selectionneurs d’acceder, sous certaines condi- 
tions, a la totalite des variants SNP et des « indels » d’une tres large 
population bovine de reference. Les possibilites de la selection geno- 
mique, en seront demultipliees, a la seule reserve, pour une race 
bovine donnee, d’acquerir un nombre suffisant de sequences ADN 
completes. II est interessant de noter que les approches statistiques 
mises au point chez les bovins, basees sur des methodes mathematiques 
et bioinformatiques tres avancees, sont devenues d’un usage courant 
pour la selection d’autres especes domestiques (pore, volailles, vege- 
taux) et aussi pour V analyse et le diagnostic des maladies genetiques 
chez l’homme. 
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Population de reference 

Phenotypes + Genotypes 
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Figure 5.1 9 Schema d'une selection genomique appliquee aux races bovines. 

Grace aux equations statistiques de predictions genomiques etablies par des etudes 
dissociations entre les phenotypes (production et qualites du lait, de la viande, apti- 
tude a la reproduction et au velage, resistance aux maladies, etc.) et les genotypes 
(marqueurs SNP et indels) d'une population de reference la plus large possible, le 
selectionneur pourra evaluer les performances phenotypiques d'un animal candidat, 
des sa naissance. II pourra done le cas echeant le selectionner comme futur reproduc- 
teur pour diffuser ses aptitudes phenotypiques, et participer ainsi en I'accelerant au 
progres genetique de son cheptel d'elevage.Le pro jet sequen<;age de 1 000 genomes, 
en enrichissant fortement les donnees genotypiques grace aux methodes d'imputa- 
tion, apportera une robustesse et une precision inegalees aux equations statistiques 
predictives des performances phenotypiques. 


Les premieres donnees du projet 1 000 genomes semble montrer 
par ailleurs que contrairement a ce qui pouvait etre attendu, le poly- 
morphisme des sequences ADN des quatre races bovines etudiees 
apparait plus grand a titre de comparaison que celui des diverses 
ethnies humaines. Faudra-t-il reviser a l’avenir les idees concernant la 
selection artificielle animale que l’on suspecte d’etre finalement 
appauvrissante et dangereuse pour la sante et les performances des 
animaux de ferme ? 
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ENCODE 

Une encyclopedic du genome humain 

Le projet ENCODE (ENCyclopaedia Of Dna Elements) est porte par 
un consortium international qui reunit plusieurs centaines de chercheurs 
et des dizaines de laboratoires dans le monde. 

Initialement dedie a F analyse des quelques 20 000 genes reveles par le 
sequengage du genome humain, en 2001 (soit a peine 1% du 
genome !), le projet ENCODE a ete etendu ensuite a Fensemble du 
genome ! L’objectif est d’etablir une liste complete de tous les ele- 
ments fonctionnels a l’ceuvre au sein du genome humain. Ces ele- 
ments (structures chimiques et leurs interactions) sont a Forigine de la 
construction de tous les types de cellules et organes qui constituent un 
individu entier. 

Grace aux progres fulgurants des technologies de sequengage et 
d’ analyses bioformatiques et statistiques, ENCODE a publie en 2012 
des millions de donnees genomiques (plus de 15 Tb de donnees) con- 
cernant les structures chimiques et leurs interactions observees chez 
plusieurs centaines de types differents de cellules humaines. 

L’un des resultats les plus remarquables de ces nombreuses etu- 
des suggere que pres de 80% du genome contient des elements 
« fonctionnels », porteurs ou associes a des fonctions biochimiques. 
Ces resultats contredisent Fidee ancienne mais repandue que la plu- 
part de l’ADN (99%) ne codant pas des proteines, est inutile (voir 
chapitre 3, Fig. 3-13). En fait, ce chiffre de 80% correspond a 
Fensemble des elements ayant « une activite biochimique 
specifique », mais sans que Fon ne puisse y associer de fonction pre- 
cise. Parmi les elements « fonctionnels » stricto-sensu, les auteurs ont 
montre qu’ environ 8 a 9% du genome serait reserve a des sites d’ inte- 
ractions specifiques avec des elements proteiques (ex : elements regu- 
lateurs, facteurs de transcription, etc...). Bien sur, n’ ayant pas etudie 
Fensemble des proteines, ils evaluent la proportion totale de ces inte- 
ractions a environ 20%, le reste des sequences « biochimiquement 
actives » pouvant correspondre a des elements regulateurs, des pro- 
moteurs (sites de demarrage de la transcription) ainsi qu’a de tres 
nombreux elements de sequence jusqu’ici negliges. En effet, certai- 
nes sequences transcrites en ARN a partir des deux brins d’ADN, ne 
sont pas traduites en proteines et jouent des roles regulateurs de 
Fexpression des genes. Le genome humain serait done constitue d’un 
entrelacs complexe d’ elements fonctionnels, codants et non codants, 
obligeant a repenser les notions de gene et d’unite minimale heredi- 
taire (voir chapitre 1, Fig. 1-10). 
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De tres nombreuses donnees concernent les sites d’hypersensibilite a 
la DNase I (DHS). Ce sont des marqueurs d’elements stimulateurs 
(enhancers) proches des promoteurs (voir le Mini-manuel de Biologie 
Moleculaire pour les aspects techniques). Detectes en grand nombre 
(plus de 2- 10 5 par type cellulaire analyse et, au total, 2,5- 10 6 sites 
identifies jusqu’ici, a comparer aux quelques 2- 10 4 genes seulement), 
les sites DHS varient selon les cellules. Les analyses bioinformatiques 
demontrent que pres de 5 • 10 6 sites DHS sont associables a un promo- 
teur actif, ce qui en laisse malgre tout 2* 10 6 , sans genes cibles identi- 
fies pour 1’instant, et revele les enormes possibilites de regulation 
genomique encore a decouvrir. II en ressort que la logique architectu- 
rale des reseaux transcriptionnels s’organisant dans 1’ expression du 
genome (voir Fig. 5-17), obeirait a un scenario ou la liaison a l’ADN, 
avec une tres haute affinite, de quelques facteurs de transcription, en 
deplagant les nucleosomes, creerait un DHS ce qui faciliterait ensuite 
la fixation des facteurs de plus faible affinite (voir Fig. 5-13). II ressort 
egalement des donnees accumulees que la fixation des facteurs blo- 
querait la methylation de 1’ADN, ce qui est conforme avec l’hypothese 
qu’il s’agit la d’une alteration epigenetique (voir Fig. 5-77) a 1’origine 
de diverses maladies, notamment les cancers (voir chapitres 5 et 6 du 
Mini-manuel Biologie Cellulaire). 

Avec le developpement du projet ENCODE, on doit s’attendre a une 
explosion du nombre d’etudes et d’analyses (GWAS) destinees a 
mieux connaitre les elements ADN responsables ou associes aux 
maladies humaines, et a la mise en oeuvre de projets similaires pour les 
especes d’interet agronomique avec 1’objectif d’ identifier les elements 
ADN responsables des phenotypes selectionnables. 



POINTS CLEFS 


> Les mecanismes de la transcription reposent sur I'activite d'une famille 
d'enzymes, les ARN polymerases, qui realisent le meme type de reaction 
(une synthese d'ARN a partir d'une matrice d'ADN) quelle que soit la cellule 
procaryote ou eucaryote consideree. Les ARN polymerases se fixent a des 
regions de I'ADN designees sous le terme de promoteurs, souvent avec 
I'aide de proteines additionnelles. L.'ARN polymerase transcrit un brin d'ADN 
oriente 3'-> 5'en un ARN oriente 5'-> 3'. 

> Au cours de la transcription, I'ARNm subit une serie de modifications qui, a 
partir du transcrit primaire, le transforme en un ARNm mature. II s'agit dans 
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I'ordre de I'addition d'une coiffe a I'extremite 5', I'epissage des introns par 
les spliceosomes et I'addition d'une queue de polyadenylation a I'extre- 
mite 3'. 

> La decouverte de la regulation des genes de I'operon lactose a mis en 
evidence pour la premiere fois, I'existence de sequences ADN regulatrices 
distinctes des sequences codantes. 

> Les sequences ADN regulatrices sont reconnues par des proteines specifiques 
activatrices ou repressives. Une meme proteine regulatrice peut etre a la 
fois repressive et activatrice selon les circonstances. 

> La regulation de I'epissage alternatif des ARN messagers a pour consequence 
principal d'accroitre la diversite des proteines cellulaires et d'aboutir a la 
synthese de proteines differentes selon les types cellulaires consideres. 

> L'heredite epigenetique repose sur la transmission d'une information qui 
n'est pas codee dans la sequence de I'ADN bien qu'elle soit transmise de 
cellule-mere en cellule-fille et de generation en generation. 

> Les deux principaux composants biochimiques du code epigenetique here- 
ditaire sont les mecanismes de methylation-demethylation de I'ADN au 
niveau notamment des ilots CpG et les modifications des queues d'histones 
par des mecanismes d'acetylation-desacetylation et de methylation- 
demethylation. 

> Chez les organismes diploides, pour la plupart des genes autosomaux, 
les deux alleles generalement s'expriment. Cependant, certains genes 
(< 1 %) sont porteurs d'une empreinte parentale qui determine lequel des 
deux alleles pourra s'exprimer. 

> La genomique etudie la totalite du genome d'un organisme. L'une de ses 
demarches principales consiste a etablir la sequence complete des geno- 
mes etudies (genomique structurale) et a proceder a I'analyse de ('expres- 
sion dans sa globalite (genomique fonctionnelle) en fonction notamment les 
conditions environnementales. 

> De nombreuses sequences genomiques sont conservees entre les especes 
temoignant sans doute a la fois de I'avantage selectif qu'elles representent 
et de leur importance pour le fonctionnement du vivant. Mais toutes sont 
loin de coder des proteines, beaucoup sont transcrites en ARN non codants, 
dont certains dotes de fonctions regulatrices. 

> Les organismes multicellulaires fonctionnent des la premiere cellule-ceuf 
et les premiers stades de developpement, sur la base de reseaux de 
genes qui assurent leur adaptation permanente aux conditions environ- 
nementales. 
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QCM - QROC 

5.1 La sequence ci-dessous appartient a un segment d’ ADN en cours de 
transcription. La fleche indique le sens de transcription de ce segment. 
Brin A : 

5 ' - CT AGTA AGG AGGTGCG A ATGCT ATG A A AGC A ACT A A ACT AGTACTTGGGGCGGTG AT - 3 ' 


Brin B : 

3 ' -GATCATTCCTCCACGCTTACGATACTTTCGTTGATTTGATCATGAACCCCGCCACTA- 5 ' 

Quel est le brin matrice ? 

Quel est le brin codant ? 

Donner la sequence du transcrit. 

5.2 L’ADN d’un gene morcele est hybride avec l’ARNm mature 
correspondant. II se forme alors une structure avec des regions comple- 
mentaires (ARN-ADN) separees par des boucles d’acide nucleique 
monocatenaire. Parmi les propositions suivantes, lesquelles sont bonnes ? 

a) Les boucles sont faites d’ADN. 

b) Les boucles correspondent aux exons du gene. 

c) Quand ils sont hybrides, l’ADN et l’ARN sont antiparalleles. 

d) Le brin d’ADN qui s’hybride a 1’ ARNm est le brin codant. 

5.3 Considerons un gene eucaryote de 1 500 pb qui code pour une 
proteine de 300 amino-acides. Peut-on predire les tailles respectives du 
transcrit primaire, des eventuels introns, de 1’ARNm et des regions 3’ 
et 5’ non codantes ? 

5.4 Une cellule est exposee a des agents mutagenes. Une proteine 
produite par cette cellule est examinee avant et apres le traitement. 
II s’avere que dans la cellule traitee, la proteine contient un trypto- 
phane (Trp) a la place d’une arginine (Arg). 

En supposant que cette substitution soit due a une mutation ponctuelle, 
quelle est cette mutation ? 

V 

5.5 A l’aide du code genetique (voir Mini-manuel Biologie mole- 
culaire, chapitre 4), completer toutes les cases du tableau : 
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5.6 Une mutation ponctuelle entrainant l’apparition d’un site donneur 
ou accepteur d’epissage peut conduire a la production : a) d’une 
proteine inactive due a l’apparition d’un codon stop premature ; b) d’une 
proteine dont la localisation dans la cellule est alteree ; c) d’une proteine 
inactive ayant perdu un domaine fonctionnel ; d) d’une enzyme inac- 
tive due au remplacement d’un seul acide amine du site actif. 

5.7 Valider les affirmations suivantes. 

a) Les regions codantes et non codantes d’un gene contiennent des 
signaux de regulation de la transcription 

b) Seules les regions codantes possedent des signaux de regulation de 
la transcription 

c) Seules les regions non codantes possedent des signaux de regulation 
de la transcription 

d) Les signaux de regulation peuvent se trouver hors des regions codantes 
et non codantes d’un gene 

5.8 Comment expliquer que l’environnement influe sur l’expression 
des genes ? 

REPONSES 


5.1 a) Brin B 
b) Brin A 

0 

5 ' -CUAGUAAGGAGGUGCGAAUGCUAUGAAAGCAACUAAACUAGUACUUGGGGCGGUGAU-3 ' 

o 

c 

5.2 Les bonnes propositions sont : a et c. Les boucles correspondent aux 
introns et le brin d’ADN qui s’hybride a l’ARNm est le brin matrice. 

rvJ 

5.3 La taille du transcrit primaire est de 1 500 nucleotides. On ignore 
la presence et done les tallies des introns. L’ ARN messager comporte, 
apres un eventuel epissage, 903 nucleotides (900 correspondent aux 
300 amino-acides et 3 au codon d’ arret). Les tallies des regions non 
codantes component au total 597 nucleotides, introns eventuels 
compris. La taille des regions non codantes en 3’ et 5’ ne peuvent pas 
etre determinees sur la base des informations fournies. 

5.4 Arg a les codons suivants : CGU, CGC, CG A, CGG, AG A, AGG 
Trp a un seul codon, UGG . 

Aucun codon de Arg ne commence par U. La mutation doit par conse- 
quent concerner cette position du codon. Etant donnee que la mutation 
est ponctuelle, il ne peut done s’agir que du changement C —> U ou 
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A — > U. Au niveau de l’ADN c’est done la paire C-G qui est mutee en 
paire T-A ou la paire A-T qui devient T-A. 


5.5 
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5.6 a, b, c : vraies (Remarque a propos de c : l’elimination d’un exon 
peut entrainer la perte d’un domaine transmembranaire necessaire a 
l’ancrage dans une membrane, la proteine est alors soluble et locali- 
see dans le cytosol) ; d : faux, la modification d’un site d’epissage se 
repercute generalement sur une sequence et non sur un seul acide 
amine. 

5.7 a) et d) 

5.8 En exergant par divers mecanismes une modulation du niveau et/ 
ou de l’activite des proteines regulatrices (activateurs et represseurs) 
de la transcription. 
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6.1 Les divisions cellulaires 

6.2 Liaison genetique et cartography 

6.3 Cartographie des centromeres et analyse des tetrades lineaires 

6.4 Cytogenetique et assignation chromosomique 

6.5 Analyse de la liaison genetique et test du CHI-deux 

6.6 Heredite liee au sexe 

6.7 Transmission de transgenes 

6.8 Derives aux lois de Mendel dans la transmission des caracteres 


to 


Connaitre les mecanismes de recombinaison genetique qui generent la 
diversite des gametes 


u 

LU 
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> Comprendre la liaison genetique et savoir cartographier des genes 

> Savoir identifier la transmission de caractere liee au chromosome sexuel 

> Comprendre en quoi les interactions genetiques modifient la transmission 
des caracteres 


6.1 LES DIVISIONS CELLULAIRES 

La mitose et la meiose constituent les deux modes de division chez les 
eucaryotes. 

La mitose 

La mitose concerne a la fois les cellules haploides et diploi'des. Elle 
aboutit a deux cellules filles genetiquement identiques a la cellule 
mere (Fig. 6.1), le nombre de chromosome par cellule demeurant 
constant. La mitose s’effectue apres la replication de l’ADN qui 
s’ accomplit au cours de la phase S du cycle cellulaire (voir dans la meme 
collection, Biologie cellulaire). Elle se subdivise en quatre phases : 

> la prophase initie la mitose avec le debut de la condensation de la 
chromatine, et 1’individualisation des chromosomes. A ce stade, les 
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deux chromatides soeurs sont accolees sur toute leur longueur, et plus 
particulierement au niveau du centromere, region d’ hypercondensa- 
tion de la chromatine, auxquels viennent se fixer de part et d’ autre des 
proteines formant des complexes proteiques, appeles kinetochores ; 
> la metaphase ou alignement des chromosomes est un point cle de 
la mitose. Tous les chromosomes ont leurs deux kinetochores lies 
aux microtubules, et s’alignent dans le plan equatorial de la cellule. 
L’equilibre etablit entre les deux chromatides d’un meme chromo- 
some les maintient et les oriente vers les poles opposes de la cellule ; 


Chromatide condensee 


2 cellules filles 
diploTdes 


Cellule diploTde 



Anaphase 


Telophase 

Figure 6.1 Representation schematique des differentes phases de la mitose. 
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> V anaphase assez rapide ne dure que quelques minutes pendant 
lesquelles les chromatides, devenues maintenant des chromosomes, 
migrent vers les poles opposes de la cellule ; 

>• la telophase se caracterise par le regroupement des chromosomes 
fils aux poles de la cellule qui marque la fin de la mitose. Des 
enveloppes nucleates se reforment autour de chaque lot de chromo- 
somes fils qui commencent a se decondenser. 

Ainsi, les deux cellules filles heritent d’un nombre egal de chromo- 
somes (n pour les cellules haploi'des et 2 n pour les cellules diploides). 
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La meiose ne peut exister que pour des cellules obligatoirement 
diploi’des et aboutit a partir d’une cellule mere diploide a quatre cellules 
haploi’des genetiquement differentes entre elles (Fig. 6.2). La reduction 
du contenu en chromosomes resulte de l’existence d’une seule repli- 
cation de l’ADN suivie par deux cycles de divisions meiotiques : 

>• la premiere division meiotique ou meiose I, au cours de laquelle les 
chromosomes dont les chromatides restent associees segregent a 
chacun des poles de la cellule lors de V anaphase I. II y a reduction 
du nombre de chromosomes, leur nombre etant divise par 2, a la suite 
de cette premiere division. On parle alors de division reductionnelle ; 
>• la deuxieme division meiotique ou meiose II durant laquelle les 
chromatides soeurs se separent et migrent aux poles de la cellule selon 
un mode egal de repartition. On parle de division equationnelle. 

Lors de la premiere division meiotique les chromosomes homologues 
s’apparient formant des structures appelees bivalents. A ce stade les 
chromatides soeurs dupliquees restent etroitement associees, et s’appa- 
rient avec leurs homologues pour former des structures a 4 chromatides. 
L’appariement est un processus complexe qui permet a chaque cellule 
fille d’heriter d’un lot haploide de chromosomes comprenant un seul 
exemplaire de chaque paire d’ homologues. 

La recombinaison meiotique 

La recombinaison meiotique designe tout processus meiotique qui 
donne un produit haploide presentant une combinaison d’ alleles 
differente de celle portee par les genotypes haploi'des a l’origine du 
meiocyte, cellule dans laquelle s’effectue la meiose, cellules de la lignee 
germinale chez les mammiferes. Cette recombinaison est detectee en 
comparant les genotypes des descendants (genotype de « sortie ») par 
rapports a ceux des parents (genotypes d’« entree »). Ainsi, tout produit 
meiotique avec une nouvelle combinaison des alleles fournis par les 
deux genotypes parentaux est par definition un recombinant. 
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Figure 6.2 Representation schematique de la meiose. 

Seules sont representees les divisions reductionnelles de la 1 re division meiotique et 
equationnelle de la 2 e division.Legraphique montre les variations du contenu en ADN et 
en chromosomes au cours de la meiose. La cellule diploYde contenant 2 n chromo- 
somes donne quatre cellules haploides a n chromosomes. Pour plus de clarte, seule la 
segregation d'un chromosome est montree ainsi que celle de ses chromatides lors de 
la 2 e division. 
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II s’avere facile de detecter les recombinants chez les organismes 
dont les cycles vitaux sont haploides comme la levure (voir Fig. 4.12 , 
cha pitre 4) car les genotypes peuvent etre deduits directement des 
phenotypes. En revanche, pour les organismes diploi'des, detecter les 
recombinants est beaucoup plus complique. On se doit de connaitre 
les genotypes des gametes de depart et des gametes resultants pour 
avoir acces aux recombinants. La demarche consiste a obtenir a partir 
de lignees pures (parents P 1 ) pour les caracteres concernes une gene- 
ration FI heterozygote (par exemple de genotype AaBb), puis de 
croiser les indi vidus FI avec un individu double recessif (de geno- 
type aabb) ayant une seule possibility de genotype pour ses gametes 
(ab), ce parent est egalement appele testeur (Fig. 6.3, voir aussi 
chapitre 1, Fig. 1.1). L’analyse de la descendance a Tissue d’un tel 
croisement appele croisement test ou « test-cross » permet d’ identifier 
les recombinants dont les phenotypes different de ceux des parents PI. 
Les recombinants sont produits par deux processus distincts : T assort- 
ment independant et les crossing-over. 


■Q 

O 

C 

=3 

Q 

in 

T 1 

O 

r\j 

© 




2 n 2 n 



b 

b 


1 

(a B j n 




Genotypes 

parentaux 


a 

a 



Meiose 

i 


Meiose 

i 



Gametes Gametes 

recombinants prentaux 


Parents 





Type 

parental 


Type 

recombinant 


Figure 6.3 Detection des recombinants d'une meiose diploTde par un croisement test. 

Les individus de la FI ayant tous le meme genotype, leur croisement avec un double 
recessif permet d'obtenir a la generation F2 des individus dont le genotype peut se 
deduire du phenotype et de les classer selon leur type parental ou recombinant. 
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La recombinaison interchromosomique 

Le brassage interchromosomique correspond a une redistribution 
aleatoire des chromosomes parentaux lors de 1’ anaphase de la 
premiere division meiotique. Ainsi dans l’exemple represente dans la 
figure 6.4, on considere 2 paires de chromosomes homologues pour 
chaque parent. On constate pour certains gametes recombinants de la 
generation FI, un tel brassage interchromosomique. Ce processus 
engendre une grande diversite de gametes, car il existe 2" possibility 
de repartition de chromosomes, soit chez l’homme 2 23 (8,4 x 10 6 ) 
gametes susceptibles d’etre genetiquement differents. 
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Figure 6.4 Recombinants issus de la recombinaison entre genes non lies a la 
suite d'un assortiment independant. 

Chaque paire d'homologue porte un des caracteres etudies. 


Lorsque les genes sont situes sur des chromosomes differents, les 
gametes sont issus d’un assortiment independant. Les genotypes 
« Aabb » et « aaBb » sont de type recombinant car ils different des 
genotypes parentaux de depart « AABB » et « aabb ». La frequence 
des recombinants a la suite d’un assortiment independant doit etre de 
50 %. Une telle valeur obtenue apres un croisement-test laisse supposer 
que l’assortiment des genes etudies est independant, c’est-a-dire que 
les genes sont portes par des paires de chromosomes distincts. 
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La recombinaison intrachromosomique 

En second lieu, la diversite des gametes peut etre accrue en raison des 
enjambements chromosomiques ou « crossing-over » (Fig. 6.2 et 6.5). 
C’est la recombinaison intrachromosomique, elle accroit encore un 
peu plus la diversite genetique des populations ulterieures. 
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Figure 6.5 Crossing-over au cours de la meiose et production de gametes 
recombinants. 


Des le debut du xx e siecle, les travaux sur l’heredite menes par 
William Bateson, avec comme modele le pois de senteur, et ceux de 
Thomas Hunt Morgan, avec comme modele la drosophile, avaient 
montre que la segregation des caracteres n’obeissait pas toujours aux 
lois de Gregor Mendel. 
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Prenons comme exemple un croisement-test ou les individus FI 
sont croises avec le parent double recessif, les resultats obtenus sont 
presentes dans le tableau 6. 1 . 

Tableau 6.1 Exemple de l'effectif des descendants 
A l'issue d'un croisement-test pour deux genes lies. 


Combinaisons 
alleliques 
gametes possibles 

Caracteristiques des individus 
de la generation F2 

Nombre 

d'individus 

FI 

P2 

Phenotypiques 

Genotypiques 

Observes 

Attendus sur la 
base du rapport 
1:1 :1:1 

AB 

ab 

AB 

AaBb 

1 402 

750 

Ab 

ab 

Ab 

Aabb 

98 

750 

aB 

ab 

aB 

aaBb 

102 

750 

ab 

ab 

ab 

aabb 

1 398 

750 


Les differentes combinaisons alleliques des gametes de la FI sont 
les suivantes : AB, Ab, aB et ab. Par contre, le testeur ne transmet que 
les deux alleles recessif s, c’est-a-dire une seule combinaison allelique 
(ab). Aussi, les differents phenotypes de la generation F2, obtenus par le 
croisement FI x P2 (parent double homozygote recessif) dependront 
uniquement de la contribution gametique de FI. Les individus sont 
comptes et classes selon leur phenotype (ou genotype deduit). On peut 
remarquer que : 

> Les valeurs observees pour chaque classe phenotypique different 
largement du rapport mendelien 1 : 1 : 1 : 1 attendu, si la segregation 
des caracteres avait ete independante (voir chapitre 1, Fig. 1.2). 

> Deux classes phenotypiques predominent, l’une correspond aux 
individus porteurs de la combinaison des deux caracteres dominants 
(A et B) et Y autre a ceux possedant les caracteres recessif s (a et b). 
Le nombre d’ individus de ces deux sous-populations represente 
93,4 % de la population totale, le rapport entre les deux sous-popula- 
tions : individus de phenotype AB ( 1 402) et individus de phenotype 
ab ( 1 398) etant voisin de 1 . II faut remarquer que ces phenotypes F2 
correspondent aux deux combinaisons gametiques (AB et ab) prove- 
nant des parents et prealablement transmis a la generation F 1 . 

> Deux classes d’individus ayant les phenotypes respectifs Ab et aB 
sont minoritaires et ne represented que (98 + 102)/3000 = 6,6 % 
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de la population F2. La encore, on notera que le rapport entre les 
deux sous-populations (98/102) est voisin de 1. 

Pour expliquer ces resultats, les geneticiens emploient F expression 
« couplage physique » entre les alleles dominants (ici A et B ) d’une 
part et les alleles recessifs ( a et b) d’ autre part. Cette liaison physique 
empeche que leur segregation soit independante a Fexception d’une 
tres faible proportion. Thomas Morgan proposa que les genes etudies 
se localisent sur une paire de chromosomes homologues (Fig. 6.6), Fun 
portant une combinaison allelique, par exemple les alleles dominants 
A et B, et son homologue la combinaison allelique associant les deux 
alleles recessifs a et b. On parle pour qualifier cette situation de liaison 
genetique. Les evenements de recombinaison intrachromosomique 
qui peuvent se produire entre la region portant les deux caracteres 
etudies etant a Forigine des recombinants observes. 
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Figure 6.6 Recombinaison entre genes lies et frequence des gametes. Un seul 
chromosome porte les 2 caracteres etudies. 


La recombinaison intrachromosomique peut se produire entre 
n’importe lesquelles des deux chromatides non sceurs (Fig. 6.7). Cepen- 
dant le pourcentage de recombinants est toujour s inferieur a 50 % en 
raison de leur rattachement au meme chromosome, ce qui empeche 
leur assortiment independant. On doit de plus noter que la valeur seuil 
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de 50 % n’implique pas forcement l’assortiment independant des 
caracteres. En effet, des genes lies mais tres distants sur un meme 
chromosome auront cependant une frequence maximale de recombi- 
naison de 50 %. Pour l’observateur tout se passe comme si des genes 
disposes ainsi etaient independants, c’est-a-dire sur deux chromosomes 
differents. C’est la forte probability qu’il y ait au moins un crossing- 
over dans le grand intervalle separant les deux genes qui favorise une 
transmission apparemment independante de ces genes, bien que 
physiquement ils soient sur le meme chromosome. 
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Figure 6.7 Exemples de possibility de crossing-over. 

Les gametes produits sont tous de type parental en absence de crossing-over (a) ; de 
type parental et recombinant lors de crossing-over impliquant les chromatides 1 et 3 (b), 
ou 1 et 4,et 2 et 3 (c).Ce dernier exemple montre que lors de la meiose les crossing- 
over peuvent s'effectuer entre n'importe lesquelles des chromatides non soeurs et que 
plusieurs crossing-over peuvent s'effectuer pour un meme bivalent. 


6.2 LIAISON GENETIQUE ET CARTOGRAPHIE 

Chaque molecule d’ADN composant un chromosome, contient des 
sequences informatives ou genes disposes lineairement. Aussi, la 
cartographic d’un genome consiste a : 
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> localiser ou assigner les genes sur les chromosomes et etablir les 
distances qui separent les genes, c’est la cartographie genetique ; 

>- reconstituer le genome a l’echelle moleculaire en etablissant au final 
la totalite de la sequence, c’est la cartographie physique. 

Naturellement, les cartographies physique et genetique, tout comme 
le sequengage sont interdependants et leur association ont favorise 
l’avancee rapide de la connaissance des genomes complexes comme 
celui de l’homme. 

Frequence de recombinaison intrachromosomique 
et distance genetique 

En augmentant le nombre de caracteres (ou genes) etudies, on constate 
que le pourcentage de recombinants parmi la descendance peut varier 
de 0 a 50 % selon la localisation du couple de caracteres observes. 
Comme la frequence de recombinaison entre deux loci reflete la 
distance genetique qui les separe, on peut evaluer ainsi les distances 
entre les genes qui determinent les caracteres : plus le nombre de 
recombinants est eleve, plus il y a en theorie de chance pour que les 
genes soient eloignes sur le meme chromosome. En resume, evaluer les 
distances entre les genes sur un meme chromosome revient a calculer 
le nombre de recombinants pour differents couples de caracteres dans 
la descendance. C’est pourquoi on utilise le pourcentage de recombi- 
nants comme une mesure de la distance lineaire separant deux genes. 
On peut ainsi etablir une carte genetique lineaire qui donne la position 
relative des differents loci ou genes les uns par rapport aux autres. Sur 
la carte, les distances sont mesurees en unite de carte genetique ou 
UG (Unite Genetique) : une UG etant la distance separant deux loci 
dont la frequence de recombinaison est de 1 % (c’est-a-dire 1 produit 
sur 1 00 de la meiose est un recombinant). L’unite la plus couramment 
employee est le Morgan (en l’honneur de Thomas Hunt Morgan). On 
parle en general de centimorgan (cM) ; 1 cM equivaut a une frequence 
de recombinaison de 1 %, soit 1 UG (chez l’homme, on considere 
qu’une distance d’un cM equivaut en moyenne a une sequence d’ADN 
de 10 6 pb). Chez le ver nematode, 1 cM equivaut a 7,5 x 10 5 pb. 

Comment cartographier plus de deux genes lies 

Quand on examine le nombre de recombinants pour differents couples 
de caracteres, on etablit des distances genetiques entre les loci compo- 
sant ces couples. Cependant, si un locus C est commun a deux couples 
(AC et BC), comment etablir la cartographie de la region ABC ? En 
effet, si A et C sont distants de 7 cM, et B et C de 10 cM, plusieurs 
combinaisons s’averent possibles, comme presente dans \a figure 6.8. 
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Figure 6.8 Positions envisagees pour differents loci portes par un meme chro- 
mosome. Les distances entre les caracteres sont donnees en centimorgans (cM). 

Dans le cas ( 1) on postulera une distance entre A et B de 10 - 7 = 3 cM, 
alors que dans le cas (2) A et B seront distants de 10 + 7 = 17 cM. 
Avec le gene B comme point de depart, deux cartes sont possibles 
respectivement BAC (1) ou BCA (2). Pour lever 1’ambiguite, il s’avere 
necessaire d’ analyser les couples deux a deux, soit dans notre exemple 
les couples de loci AB, BC, AC. Considerons que ABC sont des alleles 
dominants et abc des alleles recessifs. Les parents P t et P 2 donnant la 
FI (de genotype AaBbCc) peuvent posseder, parmi d’autres, les geno- 
types respectifs suivants : aaBBCC et AAbbcc, auxquels on se referera 
par la suite. 

Lors d’un croisement test de FI avec un triple recessif aabbcc, les huit 
types gametiques FI haploides possibles peuvent etre denombres grace 
aux phenotypes des individus diploides de la generation F2, puisque 
le testeur gametique n’apporte que le type gametique abc ( Tableau 6.2). 

Tableau 6.2 Classification et denombrement 

EN FONCTION DE LEURS PHENOTYPES D'lNDIVIDUS ISSUS D'UN CROISEMENT-TEST. 


Phenotypes 

Genotypes 

Nombre d'individus 

aBC 

aaBbCc 

1 250 

Abc 

Aabbcc 

1 258 

abC 

aabbCc 

143 

ABc 

AaBbcc 

139 

ABC 

AaBbCc 

93 

abc 

aabbcc 

99 

aBc 

aaBbcc 

8 

AbC 

AabbCc 

10 
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Les phenotypes aBC et Abe correspondent aux types parentaux de 
depart. Its sont a la generation F2 les populations les plus representees 
(1 250 et 1 258 individus respectivement). Les autres populations ne 
component qu’un faible nombre d’individus qui resulte de recombi- 
naisons (brassages intrachromosomiques) lors de la meiose aboutissant 
a la formation des gametes de la generation F 1 . 

La comparaison entre types parentaux et types recombinants permet 
d’identifier les evenements de recombinaison entre deux loci. Par 
exemple pour les loci A et B, les recombinants qui different des types 
parentaux aB et Ab sont dans l’ordre ab et AB ; leur representation 
dans les differentes populations recombinantes s’etablit a 143 + 139 + 
93 + 99 = 474 individus, soit une frequence de recombinaison de 
15,8 % (x 100). Pour les loci A et C, les recombinants sont ac et AC, 
avec au total 93 + 99 + 8 + 10 = 210 individus soit une frequence de 
7 %. Enfin pour B et C, les recombinants sont Be et bC, avec au total 
143 + 139 + 8 + 10 = 300 individus soit une frequence de 10 %. Dans 
les trois cas les frequences de recombinaison sont inferieures a 50 %, 
les trois genes sont lies et situes sur le meme chromosome, les deux 
genes les jAus distants etant A et B avec 15,8 % de recombinaison soit 
15,8 cM. A ce stade, nous pouvons preciser la carte genetique pour 
ces trois genes. 

L’ordre des genes defini arbitrairement en (2) en pla^ant A a droite 
de C, correspond a celui determine par V analyse des frequences de 
recombinaison. On doit remarquer que pour cet ordre la somme des 
distances entre AC et BC (7 + 10 = 17 cM) differe malgre tout de celle 
calculee a partir des recombinaisons entre les loci A et B (15,8 cM). 
Pour expliquer cette difference, il faut prendre en consideration les 
deux sous-populations les moins representees ayant les phenotypes : 
aBc et AbC. Pour les caracteres A et B, nous retrouvons les deux 
combinaisons parentales aB et Ab. Dans la figure 6.9, on decrit la 
possibility que deux « crossing-over » se soient produits, Pun entre A 
et C, et 1’ autre entre C et B conduisant a des doubles recombinants. 
Leurs phenotypes pour les caracteres A et B etant identiques a ceux 
observes chez les parents, nous avons exclu ces deux sous-populations 
rares du comptage des recombinants formes entre A et B. Puisqu’il 
s’agit de doubles recombinants, nous devons au contraire les compta- 
biliser deux fois. Ainsi la frequence de recombinaison (FR) entre les 
caracteres A et B devient : 

FR = [143 + 139 + 93 + 99 + 2 (8 + 10)] x 100 = 17 % 

La distance separant A et B s’eleve maintenant a 17 cM, ce qui 
correspond bien a la somme des deux plus petites distances calculees 
ci-dessus. 
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Figure 6.9 Exemple de double « crossing-over ». 

Dans I’ exemple choisi des doubles recombinants ont ete mis en 
evidence, car chaque « crossing-over » est entoure par une paire de 
genes possedant deux alleles distincts pour chaque caractere. Si le 
caractere C avait ete homozygote (alleles C), les doubles recombi- 
nants auraient eu comme phenotypes aBC et AbC, c’est-a-dire 
identiques pour les trois caracteres aux types gametiques parentaux de 
depart : ( aaBBCC etAAbbCC). Ils auraient alors ete classes par erreur 
dans les types parentaux lors de 1’ identification et du comptage des 
individus F2. 

Remarque : lorsque la distance entre deux loci est relativement 
grande, 1’ existence de deux crossing-over, voire plus, peut entrainer 
une sous-estimation de la distance reelle les separant. II s’avere done 
necessaire d’ avoir de nombreux caracteres (marqueurs) repartis a 
des intervalles reguliers sur le chromosome, afin d’obtenir une carte 
genetique la plus proche possible de la realite. 

Les sous-populations de doubles recombinants ont des effectifs tres 
faibles compares aux autres populations. C’est pourquoi un seul arran- 
gement des genes sur le chromosome, parmi les differents possibles, 
peut donner ces sous-populations rares lors de double crossing-over. 
Ceci permet, en examinant la composition de la descendance, de 
deduire directement l’ordre des trois genes en confrontant les differentes 
combinaisons theoriques possibles ( Fig. 6. 10 ). On voit que, parmi les 
trois arrangements theoriques, seul l’ordre (3) donne des doubles 
recombinants compatibles avec les plus faibles effectifs observes dans 
les sous-populations de la descendance soit acB (8 individus) et ACb 
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(10 indi vidus). Ce resultat est en accord avec le denombrement des 
differentes sous-populations et avec l’hypothese (2) de depart. 
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Figure 6.10 Differentes combinaisons de doubles recombinants. 

Pour retrouver les genotypes parentaux (aB ou Ab),seule la combinaison 3 permet de 
I'obtenir avec deux crossing-over, chacun d'eux s'effectuant entre des couples de 
caracteres diff erents. 


La notion d'interference entre crossing-over 

v 

A partir des frequences de recombinaisons etablies entre les differentes 
paires de genes, il devient possible d’estimer, de maniere theorique, 
pour la region concemee, le pourcentage de doubles recombinants. Si 
la frequence de recombinaison entre A et 5 est de 7 % et celle entre A 
et C de 10 %, la frequence d’ apparition des doubles recombinants 
devrait etre egale a 0,07 x 0,10 = 0,007 = 0,7 %. Ce qui correspond a 
un nombre theorique d’ indi vidus de (0,7 x 3 000)/ 100 = 21 indi vidus 
doubles recombinants. Or dans notre exemple, sur les 3 000 individus 
composant la generation F2, on en denombre 18. La difference suggere 
que, dans les regions proches, il n’y a pas d’independance dans la 
realisation du crossing-over. Il existe une interference (I) qui s’explique 
par le fait que l’existence d’un crossing-over diminue la probability 
qu’un deuxieme crossing-over se produise dans une region tres proche. 
I peut s’ exprimer ainsi : 

I _ i nombre de doubles recombinants observes 
nombre de doubles recombinants attendus 

Le rapport entre les nombre de recombinants observes et attendus 
est appele coefficient de coincidence (cdc), done 1=1- cdc. 
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Quand 1 = 1, 1’ interference est maximale, il n’y a pas de doubles 
recombinants observes dans la region concernee. En revanche si I = 0, 
le nombre attendu est identique au nombre theorique, done le rapport 
ou coefficient de coincidence est egal a 1. En general, la valeur de I 
se situe entre 0 et 1, dans notre exemple 1 = 1- 18/21, 1 = 1- 0,85 
d’ou I = 0,15. Cette valeur de l’interference reflete l’ecart entre le 
nombre d’individus observes et le nombre d’individus attendus. 
L’existence d’ interferences designe une plus grande frequence des 
simples crossing-over dans une region chromosomique. 

6.3 CARTOGRAPHIE DES CENTROMERES 
ET ANALYSE DES TETRADES LINE AIRES 

Les centromeres, regions des chromosomes qui ne presentent pas 
d’heterozygotie, sont difficiles a cartographier. Cependant, chez des 
champignons comme Neurospora crassa dont les produits de la meiose 
sont ordonnes dans l’asque, les centromeres peuvent etre cartographies. 
En effet, le meiocyte produit une tetrade lineaire, puis chaque spore 
subit une mitose postmeiotique (Fig. 6.1 1). Les huit ascospores, consti- 
tuent une octade, et sont reparties dans l’asque en fonction du profil 
de segregation resultant des deux divisions meiotiques. Ainsi, on peut 
utiliser la cartographic du centromere pour estimer la distance qui 
separe un locus du centromere d’un chromosome. Cette technique est 
basee sur le fait qu’a la suite d’un crossing-over lors d’une meiose 




Divisions Probability 

meiotiques equivalentes 


Figure 6.1 1 Les quatre differents profils de segregation de seconde division. 

A la suite d'un crossing-over impliquant deux chromatides non soeurs, les differentes 
combinaisons sont indiquees par les fleches,/! et a segregent dans les noyaux distincts 
lors de la seconde division meiotique. La repartition des ascospores dans I'asque 
lineaire depend des chromatides impliquees dans le crossing-over. 
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l’ordonnancement impose aux ascospores sera modifie. Par exemple, 
en croisant deux indi vidus ayant chacun un allele different ( a ou A) a 
un locus et en absence de crossing-over dans la region comprise entre 
le locus et le centromere, on observera une octade comportant deux 
blocs adjacents de quatre ascospores (l’un de genotype a et P autre de 
genotype A). En revanche, si un crossing-over s’effectue dans cette 
region, les ascospores seront reparties par bloc de deux en fonction 
des chromatides impliquees dans la recombinaison. On obtient ainsi 
quatre differents profils de repartition (Fig. 6.11). On les appelle 
profils de segregation de seconde division (M n ) car les alleles a et A, 
du fait du crossing-over, se retrouvent dans les noyaux a la fi n de la 
premiere division. Sans crossing-over, les noyaux a l’issue de la premiere 
division porteront les memes alleles ( aa ou AA), on parle alors de 
profils de segregation de premiere division (Mj). 

La frequence des octades ayant un profil M n doit etre proportionnelle 
a la distance qui separe le locus du centromere, elle peut done servir 
pour estimer la taille de la region. Apres un croisement entre individus 
A et a, on denombre les octades de profil M r et celles de profil M n . II 
en resulte que le pourcentage de recombinants est egal a : 

Nombre de MII/Nombre total d’ ascospores (M r + M n ) 

En realite, la valeur trouvee represente un nombre de meiose et non 
le nombre de chromatides recombinantes. Comme dans les meioses, 
seulement 50 % des chromatides sont recombinantes, on doit diviser 
la frequence des M n par 2 pour la convertir en unites genetiques. 

Inversion chromosomique et cartographie 

Chez la drosophile la cytogenetique permet de reperer les inversions 
chromosomiques. En effet, dans les glandes salivaires de ces insectes, 
on trouve des chromosomes polytenes, chromosomes geants a la 
suite de multiples duplications de leurs chromatides qui restent 
soudees donnant un profil de bandes caracteristiques de chaque chro- 
mosome. Les mutations responsables de rearrangements chromosomi- 
ques comme des inversions peuvent alors etre facilement mises en 
evidence sur un tel chromosome polytene grace a une modification de 
l’agencement des bandes (Fig. 6.12). Si a cette mutation est associe 
un nouveau phenotype, le geneticien peut determiner la position 
approximative de 1’ allele mute responsable de ce nouveau phenotype. 

Grace aux chromosomes polytenes, il a ete possible de caracteriser 
un gene homeotique, le gene bithorax ( BX-C) par une marche sur le 
chromosome. Les auteurs avaient remarque que des inversions dans la 
region 89E du chromosome 3 affectaient profondement l’embryon de 
drosophile. Cette region devait correspondre a un gene majeur du 
developpement. Cependant, ils ne disposaient pas de sonde pour 
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Figure 6.1 2 Exemple d'utilisation d'une inversion chromosomique identifiee sur 
un chromosome polytene pour la localisation d'un gene. 

Dans I'exemple montre I'inversion d'une partie des regions a permis de rapprocher une 
region connue portant legene rosyde la region dans laquelleon suspecte la presence 
d'un gene implique dans le developpement BX-C, mais encore non identifie. 


commencer la marche dans cette region. En revanche, ils connais- 
saient dans la region 87E, la presence du gene rosy (implique dans la 
couleur de l’oeil) pour lequel ils disposaient d’une sonde specifique. 
Des chromosomes issus de mutants presentant une inversion entre les 
regions 87E et 89E ont ete hybrides avec des sondes specifiques du 
gene rosy. Ainsi, une sonde s’hybrida au niveau du point de cassure. 
Une banque realisee a partir de l’ADN presentant I’inversion a ete 
criblee avec la sonde du point de cassure afin d’isoler le fragment 
situe au point d’inversion qui doit contenir a la fois les sequences 87E 
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et 89E. Apres hybridation sur un chromosome normal, ce fragment 
revele bien les deux regions 87E et 89E. Avec la partie du fragment 87E/ 
89E reconnaissant 89E, la marche vers le gene BX-C peut commencer. 


6.4 CYTOGENETIQUE ET ASSIGNATION CHROMOSOMIQUE 

Cette approche du genome eucaryote s’emploie pour une localisation 
des genes et des sequences anonymes sur les chromosomes. En general, 
ce sont des sequences deja connues qui, par diverses methodologies, 
sont assignees sur un chromosome. 

La technique d’ hybridation de cellules somatiques est utilisee pour 
la cartographie du genome de nombreuses especes. Elle consiste comme 
le montre la figure 6.13 a fusionner des cellules d’especes differentes. 
La fusion cellulaire (fibroblastes humains/cellules tumorales de souris 
par exemple) est suivie par une fusion des noyaux, et les cellules 
hybrides uninuclees contiennent en melange des chromosomes humains 
et des chromosomes murins. Comme les chromosomes humains different 
des chromosomes murins par leur nombre et leur taille, ils peuvent 
etre distingues au sein d’une cellule hybride. Cependant au cours des 
divisions cellulaires, les cellules hotes de souris, immortelles car 
tumorales, perdent de fa^on aleatoire une partie des chromosomes 
humains. Cette elimination peut etre suivie en microscopie grace aux 
techniques de cytogenetique, technique qui repose sur la coloration 
des chromosomes. Les cellules hybrides sont cultivees sous forme de 
lignees separees, chacune d’elle ayant un contenu distinct mais bien 
identifie en chromosomes humains. 

T3 

Avec une banque chromosomique complete, c’est-a-dire dont 
l’ensemble des lignees contient tous les chromosomes d’une espece, 
ici l’homme, il s’avere possible de rechercher la presence d’un gene 
ou d’un marqueur de type mini ou microsatellite. Comme la sequence 
est connue, la recherche s’effectue le plus sou vent par PCR avec comme 
matrice l’ADN extrait des differentes lignees. La combinaison des 
resultats obtenus permet d’assigner celle-ci a un chromosome, comme 
le montre la comparaison des lignees hybrides presentee dans le 
tableau 6.3. 

En comparant les resultats, on observe que : 

> la sequence A se trouve dans deux lignees 1 et 3, qui ont en 
commun le chromosome 2 1 ; 

> la sequence B est presente dans les lignees 3, 4 et 5, qui toutes 
possedent le chromosome 10 ; 

> la sequence C est mise en evidence dans les lignees 1 et 3, qui ont 
en commun le chromosome 2 1 ; 
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Fibrobaste 

humain 
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Milieu contenant 
le virus 
de Sendai 



Formation 

d’hybrides 


Proliferation 
cellulaire 
et formation 
des colonies 



Colonie 

d'hybrides 

Figure 6.1 3 Techniques d'obtention d'hybrides somatiques. 

Les hybrides (homme/souris) sont produits par fusion cellulaire grace au virus de Sendai 
qui est utilise comme agent de fusion. Dans les heterocaryons, les deux noyaux vont 
fusionner, et la cellule hybride contiendra dans son noyau le genome murin et le 
genome humain.Tres rapidement,une partie des chromosomes humains disparaitront 
alors que la cellule tumorale conservera la totalite du genome murin. Par analyse cyto- 
genetique, on caracterise chaque colonie hybride par son contenu en chromosomes 
humains encore presents dans les cellules tumorales. 
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Tableau 6.3 Sequences humaines presentes dans les lignees hybrides 

ET CHROMOSOMES HUMAINS CONTENUS DANS CHACUNE D'ELLES. 



Lignees cellulaires hybrides 

1 

2 

3 

4 

5 

Sequences humaines 
recherchees 

A 

+ 

- 

+ 

- 

- 

B 

- 

- 

+ 

+ 

+ 

C 

+ 

- 

+ 

- 

- 

D 

+ 

+ 

- 

+ 

- 

Chromosomes humains 
presents dans la lignee 

1 

- 

+ 

- 

- 

- 

10 

- 

- 

+ 

+ 

+ 

21 

+ 

- 

+ 

- 

- 


> la sequence D est observee dans les lignees 1, 2 et 4, qui en 
revanche ne possedent pas le meme assortiment chromosomique ; 
le resultat dans ce cas s’avere inexploi table. 

On peut done assigner au chromosome 10 la sequence B et au 
chromosome 2 1 les sequences A et C. De tels resultats amenent a une 
localisation « grossiere » d’une sequence. On determine le chromo- 
some porteur de la sequence, sans toutefois en preciser la region (bras 
court, bras long par exemple). 

6.5 ANALYSE DE LA LIAISON GENETIQUE 
ET TEST DU CHI-DEUX OU % 2 

En genetique, les resultats experimentaux sont souvent proches des 
resultats attendus, mais cependant legerement differents. Un test statis- 
tique s’avere necessaire pour confronter ces resultats entre eux et 
valider Fhypothese de depart. Le test du % 2 permet ce controle. II 
constitue un moyen de quantifier les differents ecarts attendus, lies au 
seul fait du hasard, entre une valeur predite et celle obtenue experimen- 
talement, si Fhypothese est vraie. Cependant, a toute valeur prise par 
un ecart correspond une probability, il s’avere done necessaire de 
definir une valeur seuil au-dela de laquelle Fhypothese est rejetee. Par 
convention, une probability inferieure ou egale a 5 % est consideree 
comme un critere de rejet de Fhypothese. Que signifie cette valeur de 
probability ? 

> Si Fhypothese est correcte et du simple fait du hasard, e’est la 
probability d’ avoir un ecart au moins aussi grand par rapport aux 
resultats prevus. 
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> Si la probability est superieure a 5 %, cela signifie que les resultats 
sont compatibles avec F hypothese de depart. 

> Le resultat du test du x 2 depend forcement du nombre d’indi vidus 
analyses. Plus il est important, plus le test est fiable. 

Le x 2 est calcule a partir de la formule suivante : 

X 2 = Z(0 - E) 2 /E pour toutes les classes analysees 

ou : O est egale au nombre observe dans une classe et E (du terme 
anglais « expected ») celui attendu. 

En analyse de liaison genetique, a partir de quel ecart a 50 % peut 
on considerer que deux genes sont lies ? Le seul critere qui puisse etre 
pris en compte c’est F absence ou la presence d’un assortiment inde- 
pendant. Pour cela, il faut tester l’hypothese de l’absence de liaison 
(hypothese nulle). Si elle est rejetee par un test de y}, F existence 
d’une liaison genetique sera retenue. 

En prenant Fexemple d’une population d’individus obtenus 
apres un croisement-test, on denombre600 descendants repartis 
comme suit : 

> 170 de phenotype AB (parental) ; 

> 136 de phenotype Ab (recombinant) ; 

> 134 de phenotype aB (recombinant) ; 

> 160 de phenotype ab (parental). 

La frequence de recombinaison est de 45 % ^270 x j . Ceci 

pourrait etre (hypothese) un cas de liaison genetique car la valeur est 
inferieure a 50 %. Un test de x 2 est done necessaire pour calculer la 
probabilite que le resultat obtenu est bien du au hasard. Pour chaque 
allele, les proportions sont de : 

Segregation de A et « 

A * Total 

Segregation B 170 134 304 

deBetZ? b 136 160 296 

Total 306 294 600 

Les proportions alleliques sont de 306/600 pour A, 294/600 pour «, 
304/600 pour B et 296/600 pour b. A partir de ces proportions, les 
valeurs attendues (E) pour les individus AB sont de : (306/600 x 304/ 
600) x 600= 155,04. 
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Le tableau des valeurs attendues est : 

Segregation de A et a 

A a Total 


Segregation 

B 

155,04 148,96 

304 

de B et b 

b 

150,96 145,04 

296 


Total 

306 294 

600 

valeur de y} est de : 




Genotype 

O 

E 

(O - E) 2 /E 

AB 

170 

155,04 

1,44 

Ab 

136 

150,96 

1,48 

aB 

134 

148,96 

1,50 

ab 

160 

145,04 

1,54 

Total 

306 

294 

X 2 = 5,97 


La valeur du x 2 est utilisee pour trouver la probabilite ( p ) asso- 
ciee au test, a l’aide d’une table standardisee de y}. Dans l’exemple 
developpe ici, la valeur de 5,97 est largement inferieure au seuil de 
probabilite de 5 % donne dans la table (non presentee ici) du y}. 
Ainsi, l’hypothese d’un assortiment independant (hypothese nulle) 
doit etre rejetee. On en conclut que les loci sont lies. 

~6 

O 

C 

=3 

6.6 HErEDITE LIEE AU SEXE 

o 

De nombreux vegetaux ainsi que la plupart des animaux presentent un 
dimorphisme sexuel, et dans la majorite des cas le sexe est determine 
par une paire de chromosomes sexuels. Chez les humains, les cellules 
contiennent 22 paires de chromosomes homologues, les autosomes, 
et une paire de chromosomes sexuels, identiques chez la femme 
(2 chromosomes X) et non identiques chez l’homme (1 chromosome X 
et 1 chromosome Y). Lors de la meiose, chez la femelle les chromo- 
somes sexuels s’apparient comme les autosomes (Fig. 6.14) et se 
disjoignent de sorte que chaque ovule, regoit un chromosome X. On dit 
que la femme est de sexe homogametique. En revanche chez l’homme, 
les chromosomes X et Y s’apparient sur de courtes regions homologues, 
les regions pseudo-autosomales, et lors de la segregation donnent deux 
types de spermatozoides, une partie recevant le X et F autre le Y. De ce 
fait, l’homme est de sexe heterogametique. 
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Figure 6.14 Region d'appariement des chromosomes sexuels chez I'Homme. 

Alors que les autosomes et les chromosomes X peuvent s'apparier sur toute leur 
longueur, seules les courtes regions telomeriques du X et du Y peuvent s'apparier au 
cours de la meiose. Les regions pseudo-autosomales ont ete identifiees en observant 
I'appariement des chromosomes X et Y lors de la meiose. Les regions non homologues 
de ces chromosomes sont appelees regions differentielles. 


Determinisme du sexe 

La determination du sexe est genetiquement definie. En prenant 
l’homme comme exemple, un gene, SRY pour « Sex Regulation on the 
Y », localise sur le bras court du chromosome Y, joue un role crucial 
dans le determinisme du sexe. En effet, il a ete montre que l’inactivation 
de ce gene chez un individu XY aboutit a un phenotype feminin. SRY 
assure une fonction d’ interrupted et le produit de son expression est un 
facteur de transcription qui se lie a 1’ ADN dans les gonades indifferen- 
ciees les transformant en testicules ; en revanche, en son absence ces 
memes gonades deviendront des ovaires. Apres formation des testi- 
cules, il y a activation des genes impliques dans la synthese et secretion 
de testosterone, hormone liposoluble responsable des caracteres 
sexuels secondaires masculins (forme corporelle, pilosite, etc.)propres 
au phenotype masculin. La testosterone se fixe sur son recepteur, code 
par le gene AR « Androgen Receptor » et porte par le chromosome X. 
Le complexe testosterone-AR passe dans le noyau ou il agit sur des 
facteurs de transcriptions qui activent la transcription de genes de la 
« masculinite ». En 1’ absence du gene AR, la testosterone ne peut pas 
agir. L’individu presente un syndrome d’insensibilite aux androgenes, 
dont fait partie la testosterone, et il n’aura aucun caractere masculin. 

Heredite liee au chromosome X 

Le chromosome X contient plusieurs centaines de genes, tres peu 
etant associes a la fonction sexuelle. Un grand nombre de ces genes se 
trouvent dans la region differentielle et n’ont done pas d’equivalent 
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sur le chromosome Y. Ces genes presentent un mode de transmission 
hereditaire dite transmission liee a l’X. Ce mode de transmission a ete 
mis en evidence en effectuant des croisements reciproques entre des 
drosophiles a yeux rouges et a yeux blancs : 

> En croisant des males a yeux blancs avec des femelles a yeux rouges, 
100 % des descendants de la FI ont les yeux rouges. Les indi vidus 
de la FI croises entre eux donnent une population F2 ou 100 % des 
femelles ont les yeux rouges alors que chez les males, 50 % ont les 
yeux rouges et 50 % les yeux blancs. 

> En effectuant le croisement reciproque, c’est-a-dire des males a 
yeux rouges avec des femelles a yeux blancs, au niveau de la FI 
toutes les femelles ont les yeux rouges et tous les males les yeux 
blancs. En croisant les individus de la F 1 entre eux, on obtient pour 
les males et les femelles 50 % de drosophiles a yeux rouges et 50 % 
a yeux blancs. 

Ce mode de transmission s’explique par la presence d’un gene de 
la region differentielle du chromosome X. L’ allele sauvage R (Rosy) 
est dominant et son produit est responsable de la couleur rouge, et 
1’ allele mute r est recessif, couleur blanche de F ceil. Dans le premier 
croisement les femelles sont RR et les males r (un seul chromosome 
X). Tous les descendants de la FI heritent d’un chromosome X 
maternel porteur de l’allele R , ils ont done tous les yeux rouges. En 
revanche, lors du croisement reciproque, les femelles sont rr et les 
males R. Les femelles de la FI ayant heritees du chromosome X 
paternel auront toutes les yeux rouges alors que les males heritent 
d’un X maternel, porteur de 1’ allele recessif, et auront les yeux blancs. 
Ceci permet de comprendre les resultats obtenus a la F2 pour les deux 
types de croisements. 

Les rapports phenotypiques differents pour les descendants des 
deux sexes constituent une caracteristique de 1’ heredite liee au sexe. 
Du fait des regions differentielles, des mutations affectant des genes 
presents dans cette region auront, meme si elles conduisent a des 
alleles recessif s, des repercutions sur la descendance. Ainsi, dans les 
families atteintes de pathologies liees a l’X on observe un desequi- 
libre au niveau des arbres genealogiques. Plus d’ individus males sont 
atteints, l’exemple le plus connu etant l’arbre genealogique de la reine 
Victoria et la transmission de l’hemophilie A a ses descendants. 
D’autres pathologies sont dues a des mutations recessives du X 
comme la myopathie de Duchenne (mutation du gene codant la 
dystrophine), le syndrome de feminisation testiculaire (mutation d’un 
recepteur aux androgenes), le daltonisme (mutation au niveau d’un 
photo recepteur), etc. 
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6.7 TRANSMISSION DE TRANSGENES 

L’ etude des genomes des organismes complexes se revele d’une 
extreme importance. L’objectif final etant 1’ etude approfondie du 
genome humain en vue d’apprehender les fonctions telles que les 
capacites cognitives, le comportement social, etc. En ce qui concerne 
1’ etude de la fonctionnalite des genes humains, on comprend facile- 
ment que l’ethique n’ autorise pas de mener ces etudes directement sur 
l’etre humain. Les experiences effectuees aujourd’hui concernent 
exclusivement des lignees cellulaires humaines cultivees in vitro et 
dans une moindre mesure la participation d’indi vidus volontaires. Le 
choix d’un modele dont la physiologie est proche de celle de Lhomme 
s’est done revele important afin d’esperer entreprendre ce type 
d’ etudes. 

V 

A cote des vertebres inferieurs (poissons et batraciens), le mammi- 
fere qui a retenu 1’ attention des geneticiens est la souris. En effet, ses 
caracteristiques sont interessantes : sa petite taille facilite son elevage, 
une femelle donne naissance a une portee de 8 a 1 2 petits, la duree de 
gestation est de 3 semaines et les jeunes atteignent la maturite 
sexuelle a l’age de 6 semaines. La souris possede en particulier une 
structure cerebrale complexe et un systeme immunitaire proches de 
ceux de 1’homme. Ce petit rongeur est utilise depuis des decennies 
par les geneticiens. Ainsi des dizaines de mutants ont, par le passe, pu 
etre caracterises et les genes impliques ont ete localises sur le 
genome. La plupart d’entre eux ont ete clones et les fonctions, qui y 
sont associees ont ete determinees. Dans une demarche de genetique 
inverse, une technique d’ in validation de gene, mettant a profit la 
recombinaison homologue, a pu etre mise au point chez la souris 
(Fig. 6.15). Les souris qui possedent un gene invalide sont aussi appe- 
lees souris « knock-out » ou mutants nuls. 

La technique est basee sur 1’ utilisation de cellules souches 
embryonnaires (voir dans la meme collection Biologie cellulaire ). Le 
gene est inactive par une strategic de recombinaison homologue 
proche de celle utilisee chez la levure (voir figure 4.14). Dans ce cas, 
le gene d’interet est remplace par un marqueur de selection constitue 
d’un gene bacterien qui confere la resistance a un antibiotique, la 
neomycine, auquel les cellules ES sont sensibles. Le gene ainsi inva- 
lide est introduit grace a un plasmide dans les cellules ES par elec- 
troporation et les cellules transferees sont selectionnees en 
presence de neomycine. Les cellules ES resistantes a la neomycine 
sont heterozygotes, car elles possedent un allele normal et un allele 
invalide. L’allele normal etant dominant, les cellules se developpent 
normalement. Les cellules ES, ainsi modifiees, sont ensuite intro- 
duites, par microinjection, dans des embryons de souris au stade 
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Figure 6.15 Methodologie generale pour la creation de souris transgeniques 
« knock-out ». 


On constate qu'il faut trois generations de souris, a partir de la mere, pour obtenir les 
individus homozygotes pour le gene invalide (invalide/invalide).Les cellules ES utilisees 
pour la transformation sont issues d'une lignee de souris agouti (couleur du pelage 
marron). Le suivi de ce caractere permet aux geneticiens de selectionner plus facilement 
les souris chimeres portant le gene invalide en FI et les souris heterozygotes en F2. 
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blastocyste. Les embryons sont done constitues de cellules ES 
normales et de cellules ES portant le gene invalide. Ils sont ensuite 
implantes dans 1’ uterus d’une femelle pseudo-gestante. Celle ci va 
donner naissance a des souris chimeres, qui possederont certains 
tissus derivant des cellules ES normales et d’autres provenant des 
cellules ES portant le gene invalide. Parmi les souris chimeres, les 
geneticiens doivent selectionner celles dont les cellules de la lignee 
germinale derivent des cellules ES portant le gene invalide. II est en 
effet indispensable de transmettre le gene invalide aux generations 
suivantes. Ainsi, une souris chimere est croisee avec une souris 
normale, afin de rechercher dans la descendance les souris hetero- 
zygotes pour le gene invalide. Finalement, pour obtenir les souris 
« knock-out », il sera necessaire de croiser deux souris heterozygotes 
pour le gene invalide qui donneront une descendance composee a 
50 % de souris heterozygotes, 25 % de souris homozygotes normales 
et 25 % de souris « knock-out », homozygotes pour le gene invalide. 
Comme nous l’avons vu precedemment chez la levure, certains 
genes sont essentiels a la viabilite. Chez la levure, le nematode ou 
bien la souris, un gene sur trois est essentiel a la viabilite. II n’est 
done pas possible d’ obtenir une souris « knock-out » qui porte une 
invalidation pour un gene essentiel. Afin de contourner en partie ce 
probleme et permettre tout de meme 1’ etude de ces genes, une stra- 
tegic originate a ete appliquee aux souris « knock-out ». II s’agit de 
P invalidation conditionnelle des genes. Cette technique met a profit 
le systeme Cre/Lox (Fig. 6.16). 

L’enzyme Cre est une recombinase du bacteriophage PI. Elle 
catalyse la recombinaison entre les deux sequences d’ ADN de 34 pb 
appelees LoxP. Si un fragment d’ADN est place entre deux 
sequences LoxP, la proteine Cre provoquera V excision de ce frag- 
ment d’ADN et d’une sequence LoxP. L’utilisation de ce systeme in 
vivo necessite le croisement de deux lignees de souris transgeni- 
ques. Une premiere lignee exprime le gene Cre et la seconde le gene 
a invalider, flanque d’une sequence LoxP a chacune de ses extre- 
mites. II est possible de recuperer, dans la descendance, des souris 
qui portent les deux types de transgenes. L’invalidation du gene 
d’interet va done dependre de l’expression de la proteine Cre. II est 
done necessaire de controler cette expression au cours du develop- 
pement et/ou en fonction des tissus. Ceci est realise en utilisant, 
pour 1’ expression de la recombinase, des promoteurs adaptes qui 
pourront etre actives a certains stades du developpement ou dans 
certains tissus. Ainsi, l’expression de la proteine Cre conduira a 
l’invalidation du gene dans le tissu ou l’organe cible au moment 
choisi par le geneticien. 
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Figure 6.16 Invalidation conditionnelle par le systeme Cre/Lox. 

Deux sequences Lox P sont inserees dans le chromosome de la souris de part et d'autre 
du fragment a deleter (le gene B dans cet exemple). L'expression ciblee de la recombinase 
Cre permet I'excision du fragment par recombinaison homologueentre les deux sequen- 
ces Lox P. Le fragment d'ADN circulaire est elimine car il ne possede pas de centromere. 
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Un nouvel outil remarquable d'ingenierie des genomes : 
le systeme CRISPR-Cas 9 

Precis, rapide, simple d’emploi et bon marche tels sont les atouts de 
ce nouveau kit d’ingenierie des genomes mis au point il y a peu de 
temps. Cet outil, denomme CRISPR-Cas9 (« Clustered Regulatory 
Interspaced Short Palindromic Repeat/CRISPR-associated protein9 » 
consiste a faire exprimer dans une cellule, 1’ enzyme Cas9, une endo- 
nuclease double brin, avec un ARN artificiel qui lui sert de guide. 
L’enzyme est ainsi amenee jusqu’a la sequence cible qu’elle clive 
specifiquement. En changeant la sequence de l’ARN artificiel, on 
cible n’importe quel gene. Ce systeme qui s’avere tres efficace pour 
modifier un genome pourrait detroner deux outils plus anciens : les 
TALENs (Transcription Activator-like Effector Nucleases) et les 
ZFNs (« Zinc Finger Nucleases »). 
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a / ZFNs (zinc finger nuclease) b / TALENs 
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Figure 6.17 Technologies d'ingenierie de genomes associees a la machinerie 
endogenede reparation de I'ADN. 

L'endonuclease Fokl peut etre f usionnee : (a) a divers domaines de liaison a TADN, struc- 
tures en doigt de zinc pour donner les ZFN (Zinc Finger Nucleases)). Les domaines ZFs 
sont assembles de fagon modulaire pour cibler des sequences precises dans un genome. 
Chaque domaine proteique reconnait specifiquement un triplet de nucleotides; 
(b) a des TALEs (facteurs de transcription produits par des bacteries pathogenes), 
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Les trois outils cites ci-dessus utilisent des endonucleases a doigt de 
zinc pour induire des cassures double brin a des loci genomiques 
cibles. Mais a la difference des deux autres qui utilisent pour le ciblage 
de l’ADN des proteines de liaison modulaires (Fig. 6-17 a et b), le 
systeme CRISPR-Cas9 utilise de petits ARN guides simple brin qui 
s’apparient par complementarite a FADN (Fig. 6-17 c). Les cassures 
double brin engendrees par les endonucleases sont reparees par les 
systemes cellulaires endogenes (voir Fig. 2-5, chapitre 2 et le Mini- 
manuel de Biologie Moleculciire). Chez les eucaryotes deux voies de 
reparation sont connues (Fig.6-17 d) : la voie de reparation par jonc- 
tion d’extremites non homologues NHEJ (« Non-Homologous End 
Joining ») et la voie de reparation par recombinaison homologue HDR 
(« Homology Directed Repair »). La premiere provoque sou vent des 
insertions ou des deletions (indels) aleatoires qui modifient le cadre de 
lecture du gene cible et de maniere significative la sequence d’acides 
amines en aval de la cassure. Des codons stop prematures peuvent 
egalement apparaitre soit au niveau de la cassure, soit en aval. La 
seconde necessite la presence d’une matrice de reparation qui est fide- 
lement copiee de sorte que des changements de nucleotides introduits 
dans la sequence de la matrice se retrouveront dans la sequence du 
gene cible, processus fort utile pour corriger une sequence indesirable. 
Le systeme CRISPR-Cas, fait de courtes sequences repetees palindro- 
miques a ete decouvert chez les bacteries et les archees. II constitue 
pour ces organismes un systeme primitif de defense contre les infec- 
tions virales. Lors d’une premiere infection les CRISPR des bacteries 
incorporent des fragments d’ADN viral et lors d’une infection ulte- 
rieure l’ADN des CRISPR est transcrit en deux molecules d’ARN, 
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constitues de repetition d'un motif d'une trentaine d'acides amines ce qui con- 
duit a la formation deTALENs (Transcription Activator-like Effector Nucleases). Au 
sein de chaque motif, les acides amines 12 et 13 reconnaissent un nucleotide 
specifique. Le choix d'assemblage des motifs permet de construire des TALEs 
artificiels susceptibles de reconnaitre en theorie n'importe quelle sequence 
d'ADN genomique. La dimerisation de Fokl est necessaire pour le clivage de 
I'ADN. Aussi, une paire de TALENs ou de ZFNs est necessaire pour generer une 
cassure double-brin de I'ADN. (C) Le systeme CRISPR-Cas9 possede deux ele- 
ments distincts : un ARN guide et I'endonuclease, Cas9. Elle est ciblee a I'ADN 
genomique par un ARNsg (ARN simple brin guide) consistant en une sequence 
de guidage de 20 nt (rose) et une sequence auxiliaire trans-activatrice compor- 
tant des boucles (rouge). Pour reussir la liaison de Cas9, une sequence particu- 
liere (NGG), appelee sequence PAM (« Protospacer Adjacent Motif®) doit etre 
adjacente a la sequence cible genomique. Cas9 contient les domaines des nucle- 
ases HNH et RuvC, elle peut couper les deux brins de I'ADN provoquant une cas- 
sure double brin (CDB « Cassure Double Brin »). La CDB peut etre reparee par 
I’une des deux voies endogenes de reparation de I'ADN (d). NHEJ : Non Homolo- 
gous End Joining ;HDR : Homology Directed Repair. 
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l’un d’eux etant complementaire de l’ADN viral a neutraliser. II guide 
une endonuclease Cas jusqu’a cet ADN que 1’ enzyme decoupe et met 
hors d’etat de nuire. Les kits utilises aujourd’hui s’inspirent de cette 
decouverte et se presentent sous la forme de vecteurs developpes pour 
l’ingenierie des genomes (Fig. 6-18). Utilises in vivo ils concement 
toutes les especes animales et vegetales et plusieurs resultats spectacu- 
laires (Fig. 6-19) confirment le grand interet de ce remarquable outil 
qui souleve egalement beaucoup d’espoir pour la therapie genique. 


ARNg 
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de 19-20pb 




pUC ori 


Kan r 


y 


Figure 6.18 Types de vecteurs utilises pour I'ingenierie de genome. 

Le vecteur contient la sequence de I'ARN guide (ARNg) sous la dependance du promo- 
teur U6,et la sequence codant Cas9 sous la dependance du promoteur CMV.En aval de 
Cas9 se trouvent une sequence de liaison 2A et un gene rapporteur codant la GFP 
(Green Fluorescence Protein) pour la selection des cellules transferees. Plusieurs 
sequences d'ARNg peuvent etre introduites dans un meme vecteur. Kan r : gene de 
resistance a la kanamycine ;pUC ori :origine de replication bacterienne. 


6.8 DERIVES AUX LOIS DE MENDEL DANS LA TRANSMISSION 
DESCARACTERES 

L'epistasie 

Le phenotype d’un individu resulte pour de nombreux caracteres de 
l’interaction entre genes. Si les effets d’un gene ne peuvent pas etre 
observes en presence d’un allele particulier d’un autre gene, on parle 
d’epistasie. Pour ce phenomene, tout type d’interactions entre genes 
entrame une modification du rapport 9:3:3: 1 a la generation F2. De 
maniere generate, on dit que 1’ expression d’un gene masque 1’ expres- 
sion de 1’ autre. Les phenomenes epistasiques se produisent uniquement 
lorsque les genes sont impliques dans la meme voie biochimique. 

N 

A titre d’exemple chez la souris, des genes impliques dans la couleur 
du pelage peuvent interagir entre eux et modifier la couleur. Des souris 
noires de race pure ont pour genotype BBCC ou B code pour un 
pigment noir et le produit de C permet le depot de pigment. Les alleles 
recessifs b et c correspondent respectivement a des pigments bruns et a 
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Figure 6.19 Principe 
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3/ Mere porteuse 


de Pingenierie du genome de macaque 


Apres fecondation de I'ovocyte (1), une micro-injection des ARN guides diriges contre 
PPAR-et Ragl, et de I'ARNm codant Cas9 est effectuee au stade une cellule (2). Les 
embryons sont ensuite implantes dans une « mere porteuse » (3). Naissance de deux 
macaques (4) avec des alleles mutants pour les deux genes cibles PPAR- et Ragl. II est 
important de noter que Pingenierie des genes se fait ici par injection directe d'ARNm 
une demarche souhaitable pour Pingenierie de genes in vivo alors que la transforma- 
tion a I'aide d'un vecteur serait susceptible d'introduire des informations indesirables. 


1’ absence de depots de pigments. Le croisement de souris noires avec 
des souris blanches de genotype bbcc, donne des descendants FI noirs 
et heterozygotes : BbCc. En F2 pour un meme phenotype, divers geno- 
types sont possibles : 

>- animaux noirs : BBCC, BBCc, BbCC, BbCc dans un rapport de 9/16 ; 
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> animaux bruns : bbCC, bbCc dans un rapport de 3/16 ; 

> animaux blancs : BBcc , Bbcc, bbcc dans un rapport de 4/16 ; 
l’absence de couleur etant due ici a l’absence de depot de 
pigment liee a la presence des deux alleles cc. 

On parle ici d’epistasie recessive. En supposant maintenant que 
1’ allele C dominant empeche le depot de pigment, les rapports seraient 
la encore modifies : 

>• animaux noirs : BBcc, Bbcc dans un rapport de 3/16 ; 

>• animaux bruns : bbcc dans un rapport de 1/16 ; 

> animaux blancs : BBCC, BBCc, BbCC, BbCc, bbCC dans un rapport 
de 12/16. 

La presence de 1’ allele C, dominant, entrame 1’ absence de pigmen- 
tation et impose la coloration blanche du pelage ; on parle d’epistasie 
dominante. 

Les interactions genetiques ont done des effets sur la segregation 
des caracteres. De plus, les genes impliques dans une cascade meta- 
bolique ou biochimique peuvent etre ordonnes si pour ces genes, on 
dispose de mutations donnant des effets differents. Si le gene epistasique 
est en amont dans la voie de synthese, on constate que, par exemple, 
dans le determinisme des groupes sanguins, la mutation du gene H 
(inactivation d’une fucosyltransf erase, allele recessif h) interdit la 
synthese des antigenes A et B. Pourtant chez les indi vidus porteurs de 
cette mutation (individus dits « Bombay » decouverts pour la premiere 
fois en Inde) le gene I responsable de la synthese des motifs biochimi- 
ques caracteristiques des groupes A, B et AB, est de type sauvage et 
fonctionnel. C’est done bien une mutation inactivatrice du gene H qui 
impose le phenotype « Bombay » et non des mutations du gene / (voir 
chapitre 1 ). 

Si le gene epistasique est en aval dans la voie de synthese, comme dans 
le cas de C dominant, on constate que malgre la synthese du pigment 
son depot est inhibe, d’ou l’absence de pigmentation des souris 
portant cet allele. 

Les genes suppresseurs 

La suppression correspond a un autre type d’interaction entre genes. 
Un suppresseur est Fallele mutant d’un gene qui inverse l’effet de la 
mutation d’un autre gene en redonnant un phenotype sauvage. Diffe- 
rents evenements peuvent conduire a la suppression. Une mutation 
peut intervenir dans le gene mute et restaure sa fonctionnalite, on parle 
de suppresseur intragenique ; une mutation peut affecter un autre gene 
que le gene mute et restaurer egalement le phenotype sauvage, il 
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s’agit d’un suppresseur extragenique. Les suppresseurs extrageniques 
ne modifieront le phenotype que chez les doubles mutants. 

V 

A titre d’exemple chez la drosophile une mutation au niveau du gene 
Pd conduit a un allele recessif pd qui a l’etat homozygote modifie la 
couleur de 1’ceil en 1’ absence de suppression. Un allele mute, su, du 
gene Su, ne genere pas en lui-meme le phenotype detectable, mais en 
revanche modifie l’effet de 1’ allele pd. Si on croise des indi vidus 
PdPdsusu (yeux rouges) avec des individus pdpd SuSu (yeux violets), 
la F 1 est double heterozygote. Les individus de la F 1 croises entre eux 
vont donner des descendants de phenotypes : 

> Yeux rouges dans un rapport de 13/16 ; ce phenotype correspond 
aux individus PdPdSuSu, PdpdSuSu, PdPd Susu, PdpdSusu, PdPd- 
susu, Pdpdsusu, et pdpdsusu. Chez ces derniers la presence des 
deux alleles du suppresseur su corrige l’effet de la mutation pd. 

► Yeux violets dans un rapport 3/16 apporte par les individus de 
genotype : pdpdSusu, pdpd SuSu. 

Dans l’exemple choisi, on a un suppresseur recessif qui agit sur une 
mutation recessive. II existe des suppresseurs dominants et recessifs 
qui peuvent agir sur des mutations dominantes ou recessives. Bien 
que 1’on puisse confondre la suppression avec l’epistasie, les rapports 
obtenus en F2 different et permettent de distinguer les deux pheno- 
menes. 
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> La mitose concerne a la fois les cellules haploi'des et diploi'des. Elle aboutit 
a deux cellules filles genetiquement identiques a la cellule mere. 

> La meiose ne peut exister que pour des cellules obligatoirement diploi'des 
et aboutit a partir d'une cellule mere diploide a quatre cellules haploi'des 
genetiquement differentes entre elles. 

> La recombinaison meiotique designe tout processus meiotique qui donne 
un produit haploide presentant une combinaison d'alleles differente de 
celle portee par les genotypes haploi'des a I'origine du meiocyte. 

> L'analyse de la descendance a Tissue d'un croisement test ou « test-cross » 
permet d'identifier les recombinants dont les phenotypes different de ceux 
des parents PI. 

> Les recombinants sont produits par deux processus distincts : Tassortiment 
independant et les crossing-over. 
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> Le brassage interchromosomique correspond a une redistribution aleatoire 
des chromosomes parentaux lors de I'anaphase de la premiere division 
meiotique. 

> La recombinaison intrachromosomique accroit encore un peu plus la 
diversite genetique des populations ulterieures. 

> La frequence de recombinaison entre deux loci reflete la distance genetique 
qui les separe sur le meme chromosome. 

> L'interference traduit le fait qu'un crossing-over diminue la probability 
qu'un deuxieme crossing-over se produise dans une region tres proche. 

> Les ascospores sont reparties dans un asque lineaire en fonction du profil 
de segregation resultant des deux divisions meiotiques. Si un crossing-over 
s'effectue entre un locus et un centromere, les ascospores seront reparties 
par bloc de deux en fonction des chromatides impliquees dans la recombi- 
naison. On peut ainsi realiser la cartographie des centromeres. 

> Des mutations facilement identifiables comme des inversions sur un chromo- 
some polytene contribuent a la determination de la position approximative 
de I'allele mute responsable d'un nouveau phenotype. 

> Le test du % 2 constitue un moyen de quantifier les differents ecarts attendus, 
lies au seul fait du hasard, entre une valeur predite et celle obtenue experi- 
mentalement,si I'hypothese est vraie. 

> Les chromosomes X et Y s'apparient sur de courtes regions homologues, 
les regions pseudo-autosomales; les regions non homologues de ces 
chromosomes sont appelees regions differentielles. 

> Le gene SRY, « Sex Regulation on the Y », localise sur le bras court du chromo- 
some Y, joue un role crucial dans le determinisme du sexe masculin. 

> Un grand nombre des genes portes par le chromosome X se trouve dans la 
region differentielle, ils n'ont done pas d'equivalent sur le chromosome Y. 
Ils presentent un mode de transmission hereditaire dite transmission liee a I'X. 

> Les rapports phenotypiques differents pour les descendants des deux sexes, 
observes apres des croisements reciproques, constituent une caracteristique 
de I'heredite liee au sexe. 

> Dans une demarche de genetique inverse, une technique d'invalidation de 
gene,mettant a profit la recombinaison homologue,a pu etre mise au point 
chez la souris. Les souris qui possedent deux copies d'un gene invalide 
sont appelees souris « knock-out » ou mutants nuls. 

> L'epistasie traduit la situation dans laquelle I'expression phenotypique 
differentielle d'un genotype a un locus est sous la dependance d'un autre 
locus. 

> Un suppresseur est I'allele mutant d'un gene qui inverse I'effet de la mutation 
d'un autre gene en redonnant un phenotype sauvage. 
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des chromosomes parentaux lors de I'anaphase de la premiere division 
meiotique. 
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> La frequence de recombinaison entre deux loci reflete la distance genetique 
qui les separe sur le meme chromosome. 

> L'interference traduit le fait qu'un crossing-over diminue la probability 
qu'un deuxieme crossing-over se produise dans une region tres proche. 

> Les ascospores sont reparties dans un asque lineaire en fonction du profil 
de segregation resultant des deux divisions meiotiques. Si un crossing-over 
s'effectue entre un locus et un centromere, les ascospores seront reparties 
par bloc de deux en fonction des chromatides impliquees dans la recombi- 
naison. On peut ainsi realiser la cartographie des centromeres. 

> Des mutations facilement identifiables comme des inversions sur un chromo- 
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lies au seul fait du hasard, entre une valeur predite et celle obtenue experi- 
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> Les chromosomes X et Y s'apparient sur de courtes regions homologues, 
les regions pseudo-autosomales; les regions non homologues de ces 
chromosomes sont appelees regions differentielles. 

> Le gene SRY, « Sex Regulation on the Y », localise sur le bras court du chromo- 
some Y, joue un role crucial dans le determinisme du sexe masculin. 

> Un grand nombre des genes portes par le chromosome X se trouve dans la 
region differentielle, ils n'ont done pas d'equivalent sur le chromosome Y. 
Ils presentent un mode de transmission hereditaire dite transmission liee a I'X. 

> Les rapports phenotypiques differents pour les descendants des deux sexes, 
observes apres des croisements reciproques, constituent une caracteristique 
de I'heredite liee au sexe. 

> Dans une demarche de genetique inverse, une technique d'invalidation de 
gene,mettant a profit la recombinaison homologue,a pu etre mise au point 
chez la souris. Les souris qui possedent deux copies d'un gene invalide 
sont appelees souris « knock-out » ou mutants nuls. 

> L'epistasie traduit la situation dans laquelle I'expression phenotypique 
differentielle d'un genotype a un locus est sous la dependance d'un autre 
locus. 

> Un suppresseur est I'allele mutant d'un gene qui inverse I'effet de la mutation 
d'un autre gene en redonnant un phenotype sauvage. 
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6.1 Quelle affirmation est exacte ? 

a) Par division mitotique, une cellule genere deux cellules filles gene- 
tiquement differentes. 

b) La mitose est reservee exclusivement aux cellules diploides. 

c) Au cours de la meiose, il y deux replications de l’ADN puis une 
seule division cellulaire. 

d) La meiose est a l’origine de la diversite genetique des indi vidus 
d’une meme espece. 

6.2 Les affirmations suivantes sont-elles vraies ou fausses ? 

a) Au cours de la prophase de la l re division meiotique les chromosomes 
sexuels chez l’homme s’apparient sur toute leur longueur. 

b) Au cours de la prophase de la l re division meiotique les chromosomes 
sexuels chez la femme s’apparient sur toute leur longueur. 

c) La division reductionnelle concerne la separation des chromatides 
d’un chromosome, et la division equationnelle la separation des 
chromosomes homologues. 

d) Les crossing-over s’effectuent entre chromosomes homologues lors 
de la l re division meiotique. 

6.3 Parmi les propositions suivantes, quelles sont celles qui sont vraies ? 

a) Les mecanismes de recombinaison genetique peuvent generer plus 
de 50 % de recombinants. 

b) Deux genes lies sont portes par des chromosomes differents. 

c) Les frequences de recombinaison entre deux loci permettent d’estimer 
la distance qui les separe sur un chromosome. 

d) La distribution des ascospores de meme genotype dans un asque 
lineaire est toujours identique. 

e) La presence de doubles crossing-over dans une meme region inter- 
fere sur le calcul des distances genetiques entre les caracteres etudies. 

f) Le test du y} valide, sur la base d’une hypothese vraie, la part du 
hasard dans les distributions phenotypiques observees par rapport a celle 
attendues. 

6.4 Chez les humains, lorsque des caracteres sont portes par la region 
differentielle du chromosome X : 

a) Le pere transmettra les alleles de ces caracteres a ses fils. 

b) Si une femme, porteuse saine, se marie avec un homme sain, la 
probability d’avoir un fils normal est de 25 %. 

c) Pour les caracteres analyses, le phenotype des filles dependra exclu- 
sivement du genotype matemel. 
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d) Si une mutation affecte Tun des caracteres, le phenotype qui en 
resulte sera majoritairement observe chez les descendants males. 
Quelles affirmations pouvez-vous retenir ? 

6.5 Retenir les propositions correctes. 

a) Les interactions geniques peuvent masquer des phenotypes. 

b) Les genes epistatiques masquent les phenotypes. 

c) Dans le cas d’epistasie dominante, par croisement entre individus 
d’une FI, une forte partie d’ entre eux sera de phenotype sauvage. 

d) Les genes suppresseurs ont toujours pour cibles les alleles recessifs 
d’autres genes. 

6.6 Si sur des individus AaBb d’une FI, issue d’un croisement AABB 
x aabb, on effectue un croisement test, au niveau de la descendance 
quel pourcentage sera Aabb si : 

a) les genes sont non lies ; 

b) les genes sont lies et distants de 20 cM ; 

c) trop proche pour qu’il y ait un crossing-over. 

6.7 Un allele recessif h, porte par le X, est responsable de l’hemophilie, 
une femme saine dont la mere est hemophile epouse un homme normal. 
Quelle est la probability d’ avoir un fils hemophile ? 

6.8 La synthese de pigments rouges chez les fleurs se fait en deux 
etapes : 

geneP gene Q 

Pigments blancs — » Pigments magenta — > Pigments rouges 

Mutes les genes P et Q codent des produits incapables d’ assurer pour 
F allele p la synthese de pigment magenta et q celle de pigment rouge. 
Pour les deux genes les mutations sont recessives. 

a) Quelle sera la couleur de la fleur d’une plante de genotype PPqq, et 
celle d’une plante de genotype ppQQ. 

V 

b) A quels rapports phenoty piques doit-on s’attendre en croisant des 
plantes QqPp entre elles ? 


REPONSES 


6.1 d) Vrai ; b) les organismes haploides comme la levure se divisent 
par mitose 


6.2 b) et d) vraies 
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6.3 c), e) et f) vraies ; a) il ne peut jamais y avoir plus de 50 % de 
recombinants ; d) la distribution des ascospores peut varier si des 
crossing-over s’effectuent entre le centromere et un locus donne. 

6.4 b) et d) vraies ; a) faux car le pere ne peut pas transmettre de 
chromosome X a ses fils ; c) faux, si la mere est heterozygote Aa et le 
pere a, les filles auront deux genotypes possibles Aa ou aa qui donneront 
des phenotypes distincts. 

6.5 a) et b) vraies ; c) faux : la majeure partie sera de phenotype mute 
impose par la presence de V allele dominant du gene a effet epistatique ; 
d) faux : ils peuvent egalement agir sur des alleles sauvages. 

6.6 a) 25 % des gametes de la FI seront de genotype Ab, la contribution 
de l’autre parent lors d’un croisement test etant ab, 25 % des individus 
auront le genotype Aabb ; b) la distance qui separe les deux caracteres 
etant deduite des frequences de recombinaison, au niveau de la F 1 les 
recombinants possibles sont aB et Ab, et representent au total 20 % de 
la descendance. Done, la moitie des recombinants, soit 10 % des indi- 
vidus de la population analysee seront Aabb ; c) aucun individu ayant 
ce phenotype ne sera observe du fait de V absence de crossing-over. 

6.7 25 % : la mere est heterozygote (saine mais de mere hemophile), 
done Hh ( H designant V allele sauvage dominant). II y a une chance sur 
deux qu’elle transmette F allele h et egalement une chance sur deux 
que l’enfant soit un fils ; 1/2 x 1/2 = 1/4 soit 25 %. 

6.8 a) Une plante de genotype PPqq ne pourra pas transformer les 
pigments magenta en pigments rouges du fait de la mutation de l’allele q 
present a l’etat homozygote. Les fleurs seront de couleur magenta. 
Celle de genotype ppQQ, malgre la fonctionnalite du gene Q , n’aura 
aucun pigment magenta, intermediate dans la voie de synthese, done 
les fleurs seront blanches. 

b) 9 : 4 : 3. En faisant le tableau de croisement on en deduit : 9/16 de 
plantes a fleurs rouges (1/16 PPQQ + 2/16 PPQq + 5/16 PpQq + 1/16 
PpQQ) ; 4/16 de plantes a fleurs blanches (1/16 ppqq +1/16 ppQQ + 
2/1 6 ppQq) ; 3/16 de plantes a fleurs magenta (1/16 PPqq + 2/16 Pqqq). 
Nous sommes ici dans un cas d’epistasie recessive, ou l’absence d’un 
produit fonctionnel en amont de la voie de synthese bloque la formation 
des pigments. 
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7.1 Genetique de 1'evolution 

7.2 Une breve histoire de I'origine des genes 

7.3 La boite a outils genetiques du developpement 

7.4 D'ou vient la nouveaute en matiere de developpement ? 


> Definir la notion devolution 


to 


CD 

O 


> Etablir les relations entre 1'evolution et la genetique du developpement 
des organismes 

> Aborder I'origine et 1'evolution de la structure des genes 

> Aborder les mutations dans la regulation des genes comme source de 
nouveaute evolutive 


7.1 GENETIQUE DE DEVOLUTION 

L’ evolution selon Darwin repose sur la selection naturelle. Depuis sa 
formulation en 1859, cette expression toute simple a fait couler beau- 
coup d’encre. Sa comprehension contemporaine, defendue par la plupart 
des biologistes, s’appuie sur le constat que les seuls indi vidus qui 
survivent (qui sont selectionnes) sont ceux qui, dans un environnement 
changeant, sont les plus aptes a se reproduire parce qu’ils y sont les 
mieux adaptes. L’environnement exerce done un tri, une selection qui 
provoque une evolution en faisant apparaitre des adaptations. La 
selection peut s’exercer a differents niveaux d’organisation des etres 
vivants : celui du materiel genetique, acides nucleiques et proteines 
ainsi que leurs complexes geniques et chromatiniens et ceux de la 
cellule, de l’organisme ou de la population. La selection procede selon 
un tri, un echantillonnage, caracterise par son caractere aleatoire. En 
effet, parmi les innombrables potentialites theoriques offertes par la 
combinatoire des variations (mutations) de tous types, seul un petit 
nombre est conserve a chaque generation et dans ce processus ou 
derive genetique, le hasard joue un role essentiel. 
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Chapitre 7 • Genetique de devolution etdu developpement des organismes 


Macro et microevolution : apergu general et definitions 

D’un strict point de vue genetique, les deux mecanismes importants 
qui alimentent les changements de frequence des alleles au sein d’une 
population sont : (i) la derive genetique (le tri aleatoire) et (ii) la 
selection reproductive liee a l’environnement. Meme en 1’ absence de 
selection, le tri aleatoire des mutations transmises entre les genera- 
tions conduira progressivement a ce que la frequence d’un allele 
tende vers 100 % (allele fixe) ou 0 % (disparition de 1’ allele) et ce 
d’autant plus efficacement que la population sera de petite taille. Pour 
des populations de plus grande taille, c’est le mecanisme de selection 
naturelle qui predominera. Quelle qu’en soit la cause, le changement 
de taille d’une population aura done un effet important sur sa capacite 
a evoluer par selection naturelle. Celle-ci suppose en effet : 

> qu’une variability heritable naturelle existe au sein de la population 
consideree ; 

> que les indi vidus engendrent plus de descendants qu’il n’en peut 
survivre ; 

> qu’au sein de la population, les individus varient dans leur capacite 
a survivre et a se reproduire ; 

> que les reproducteurs les plus actif s transmettent leurs caracteristiques 
genetiques a leurs descendants alors que les moins actifs ne le font 
pas. 

Si ces diverses caracteristiques contribuent a augmenter l’adaptabilite 
evolutive des individus qui les possedent, ils survivront et se reprodui- 
ront plus efficacement que les autres. Inversement les caracteristiques 
qui amoindriront 1’ adaptability des individus qui en sont porteurs 
contribueront a rarefier la representation de ces derniers au sein de la 
population. 

On designe par le terme de macroevolution celle qui intervient au 
niveau de l’espece ou a un niveau superieur. Typiquement la macro- 
evolution fait reference aux changements qui modified l’embryogenese, 
les plans d’ organisation, les principals caracteristiques des individus 
et qui sont a la base de la phylogenie des grands groupes du monde 
vivant. La microevolution par contre designe au sein d’une population 
des changements evolutifs de moindre ampleur comme ceux qui sont 
relatifs a la frequence des alleles. Les biologistes considered que macro- 
evolution et microevolution sont liees par le fait que 1’ accumulation 
graduelle de petits changements entraine les changements de plus 
grande ampleur, meme si des sauts evolutifs rapides sont egalement 
visibles dans les traces paleontologiques. 

Certains biologistes, peu nombreux mais tres actifs et relayes par des 
mouvements religieux, surtout aux USA, admettent 1’ existence des petits 
changements evolutifs, mais rejettent l’idee d’une macroe volution qui 
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s’oppose, a leurs yeux, a F existence d’un dessein intelligent (« intelli- 
gent design ») qui n’est, a vrai dire, que la forme moderne de la 
creation ex nihilo du monde vivant suivant les dogmes des principals 
religions monotheistes (mouvements creationnistes). Ce mouvement 
antievolutionniste fait echo en ce debut de xxi e siecle a la montee des 
fondamentalismes religieux. 

Les racines d'une nouvelle discipline : I'evo-devo 

L’etude des processus genetiques intervenant lors du developpement 
des organismes a donne naissance a un courant scientifique tres 
fecond qui s’efforce d’etablir un lien entre l’origine des changements 
observes au cours du developpement des organismes depuis l’oeuf 
feconde jusqu’a l’adulte et F evolution des genes conduisant a l’appa- 
rition des especes. Cette discipline beneficie aujourd’hui des progres 
considerables decoulant (i) de la decouverte des genes controlant notam- 
ment le developpement embryonnaire precoce et (ii) des connaissances 
de plus en plus nombreuses apportees par le sequengage complet des 
genomes. 

L’e volution du developpement biologique, ou en abrege l’evo-devo, 
se propose done de comparer les processus developpementaux des 
organismes vivants (animaux et plantes). Elle essaie de determiner les 
relations ancestrales qui existent entre les organismes et comment ces 
processus ont evolue. L’evo-devo aborde ainsi l’origine et 1’ evolution du 
developpement embryonnaire. Elle analyse comment les changements 
dans le developpement et les processus qui le dirigent ont produit de 
nouvelles caracteristiques biologiques. Elle s’interesse au role de la 
plasticite developpementale dans 1’ evolution et comment l’ecologie 
intervient dans ces phenomenes. 

Bien que la vieille theorie d’Ernest Haeckel qui affirmait au 
xix e siecle, que « l’ontogenie recapitule la phylogenie » - e’est-a-dire 
que le developpement d’un organisme reflete exactement 1’ evolution 
de son espece - soit depuis longtemps rejetee, certains biologistes 
admettent cependant Texistence de nombreuses filiations evolutives 
entre ontogenie et phylogenie. Les memes processus generaux agiraient 
dans Fun et l’autre cas comme, par exemple, la reutilisation d’anciens 
genes et reseaux de genes pour creer de nouvelles structures et de 
nouveaux reseaux. Une sorte de recyclage des instructions geniques 
qui ressemble a un bricolage (« faire du neuf avec de l’ancien ») selon 
Fexpression de F. Jacob. Le principal interet de cette demarche 
consistait a Forigine a mettre en evidence Fhomologie des mecanismes 
moleculaires et cellulaires qui controlent la construction des organismes 
puis le developpement. Aujourd’hui la demarche s’applique a tous les 
aspects et echelles de F evolution. 


Copyright © 2015 Dunod. 


208 


Chapitre 7 • Genetique de /'evolution et du developpement des organismes 


7.2 UNE BREVE HISTOIRE DE L'ORIGINE DES GENES 

L'ARN a-t-il precede I'ADN comme support moleculaire 
de I'heredite ? 

Le monde ARN est une hypothese resultant de l’idee que l’evenement 
le plus critique se rapportant a l’origine de la vie repose sur T emer- 
gence d’une molecule autoreplicative, une molecule qui puisse a la 
fois se copier elle-meme et muter c’est-a-dire evoluer pour accroTtre 
Eefficacite de sa propre replication, devolution fonctionne en effet 
sur la base de la variation et de la selection et cette derniere se mesure 
toujours sous le sceau de la multiplication la plus efficace, la capacite 
a faire la meilleure entite possible. 

Dans le monde d’aujourd’hui, l’ADN est le premier materiel gene- 
tique. II est traduit grace a un dispositif faisant appel a 1’ ARN et a un 
mecanisme de synthese proteique specifiant la position de 20 amino- 
acides dans les proteines enzymes. Trois systemes moleculaires done 
qui creent le paradoxe de ne pas livrer la cle du commencement. Ce 
paradoxe est cependant en passe d’etre resolu aujourd’hui a la suite de 
deux decouvertes capitales. La premiere est que 1’ ARN est une molecule 
biochimiquement plus primitive que 1’ ADN. La seconde est que 1’ARN 
est capable d’effectuer le transfert de la liaison phosphodiester neces- 
saire a sa propre synthese et possede ainsi une capacite enzymatique 
(ribozyme) a 1’ instar des proteines. 

En appui de la premiere decouverte, il faut noter aussi que les desoxy- 
ribonucleotides sont obligatoirement synthetises a partir de ribonucleo- 
tides precurseurs, que la synthese de l’ADN necessite des amorces ARN 
et que lorsqu’il s’agit de terminer la synthese de 1’ ADN chromosomal 
a Eextremite 3’ de la chaine ADN e’est une telomerase qui fonctionne en 
copiant une malrice ARN (voir le Mini Manuel de Biologie moleculaire ). 

L’hypothese d’un monde initial ou ce serait les proteines qui diri- 
geraient le transfert de 1’ information est tres fortement improbable. 
Aucune forme d’ interaction entre proteines n’est en effet connue, 
comme pouvant etre apte a se copier, se repliquer et muter comme 
EARN. L’aspect le plus decisif de V evolution moleculaire primitive 
reside dans la capacite des molecules a croitre c’est-a-dire a s’auto- 
repliquer dans des conditions compatibles avec la variation et la 
mutation, a foumir des nouveautes sur lesquelles la selection naturelle 
pourra operer afin d’ameliorer la replication dans un environnement 
changeant. C’est EARN qui reunit le mieux et de loin les proprietes 
necessaires a E emergence des molecules a partir desquelles se construi- 
ront les premiers systemes. Ces demiers doivent avoir la double propriete 
d’etre depositaires d’une information genetique et etre aptes a la mettre 
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en oeuvre a la fois pour la transmettre par autoreplication, l’ameliorer 
par mutation et 1’ exprimer en di verses fonctions par ses proprietes de 
catalyse. 

La question capitale concernant le monde ARN est le classique 
paradoxe de la taille necessaire pour fonctionner comme une enzyme. 
Une enzyme ARN devrait avoir une taille de 300 a 600 nucleotides 
pour, par la creation de sites actifs, etre reellement apte a realiser 
diverses fonctions catalytiques. Or, il parait peu vraisemblable qu’une 
telle creation resulte d’un jeu aleatoire de 4 3M possibilites, soit 10 l8# 
molecules. Walter Gilbert propose pour surmonter cette difficult^ une 
solution qui recueille 1’ adhesion d’un nombre grandissant de biolo- 
gistes moleculaires : les premieres molecules d’ARN avaient une 
structure intron-exon. 

Origine des introns et des exons, structure des genes 
et evolution 

Selon cette theorie, le materiel genetique ARN serait forme de courts 
modules, composes chacun de 30 a 40 bases (des exons ARN en quelque 
sorte), reunis par des introns ARN autoepissables. Cette structure 
lineaire serait bien adaptee a la formation d’une copie. Apres 1’ operation, 
les introns s’autoepisseraient pour laisser ensemble une serie d’ exons 
qui se replieraient de telle maniere a former un ribozyme. La presence 
d’ introns resout trois difficultes et tout d’abord, celle du paradoxe de 
la taille de l’ARN. En effet, par le jeu d’un assemblage d’exons de 
petite taille (30 a 40 bases) une molecule a fonctions complexes peut 
en resulter. En second lieu, un moyen est foumi permettant de distinguer 
le materiel qui doit etre copie pour produire des descendants, du 
materiel qui apres epissage, se replie pour donner un ARN a fonction 
enzymatique. Enfin un materiel est obtenu qui en favorisant les recom- 
binaisons illegitimes, stimule l’obtention de mutations selectionnables. 

L’aspect particulierement novateur de ce modele reside dans la 
formation d’une structure intron-exon apte a realiser une transposition 
d’exons. En effet, dans l’hypothese d’un autoepissage embarquant les 
deux introns enserrant un exon (Fig. 7.1) un transposon se forme qui 
peut se recombiner avec un autre intron present au sein d’un gene 
ARN primitif accepteur. Un brassage d’exons en resulte, processus 
considere aujourd’hui comme essentiel dans la formation des nouveaux 
genes au cours de 1’evolution. L’origine de ce type d’evenement se 
situerait ainsi des les premiers mecanismes moleculaires ayant conduit 
a 1’ emergence des premiers genomes dans un monde ARN. 
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Figure 7.1 Representation schematique d'une structure intron-exon au niveau 
d'un ARN primitif autoepissable. 

Alternativement : (i) les deux introns sont episses pour produire un ribozyme exduant 
I'exon 2 (ii) les extremites eloignees des deux introns epissent ensemble et produisent un 
exon transposable qui pourra occuper une nouvelle position au sein d'un nouveau gene. 

7.3 LA BOITE A OUTILS GENETIQUES DU DEVELOPPEMENT 

Ce sont les differents alleles des genes dits du developpement qui 
dirigent le plan architectural du corps, le nombre, l’identite et la forme 
des differentes parties des organismes multicellulaires. Ces genes sont 
hautement conserves parmi les grands phylums animaux. Ils ne repre- 
sented cependant qu’une petite fraction des genomes. 


Figure 7.2 Organisation et expression des genes HOX chez la drosophile et 
la souris. 

Les huit genes homeotiques de la souris sont organises en deux clusters (complexes 
de genes). Cinq des huit genes sont localises dans le complexe Antennapaedia et 
les trois autres dans le complexe Bithorax. II y a une correspondance colineaire 
entre I'ordre des genes homeotiques le long du chromosome et les profils d'expres- 
sion selon I'axe antero-posterieur des embryons. Ainsi le gene lab, en position la 
plus extreme en 3' du complexe Antennapaedia s'exprime dans la partie la plus >• 
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> anterieure de latetede I'embryon.Au contraire,legene/4fc>d-B,en position la plus5'du 
complexe Bithorax est exprime dans la region la plus posterieure. La signification de 
cette colinearite n'est pas etablie mais elle est observee pour tous les embryons y com- 
pris chez les mammiferes et I'homme. La souris possede 38 genes Hox organises en qua- 
tre clusters (un seul est presente ici, le cluster Hoxb). Chaque cluster contient 9 ou 1 0 
genes homeotiques qui correspondent a chaque gene du cluster de la drosophile, 
avec le meme type de colinearite. Comme la souris, I'homme possede quatre clusters 
de genes Hox avec les memes caracteristiques : HOXA (Chr 7), Hoxb (Chr 1 7), HoxC (Chr 
1 2), HOXD (Chr 2). 
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Ils participent a des voies de signalisation, codent des facteurs trans- 
criptionnels, des proteines de 1’ adhesion cellulaire, des recepteurs de 
la surface cellulaire et des morphogenes. Leurs fonctions sont forte- 
ment correlees a leurs profils d’expression dans le temps et dans 
l’espace. L’evo-devo se propose d’ identifier tous ces genes en s’atta- 
chant a definir leurs identites, produits, fonctions et interactions. A 
titre d’exemple, les genes HOX (Fig. 7.2) , qui appartiennent a Tune 
des families les plus importantes codent des facteurs de transcription 
dont la sequence comporte des homeoboites. II s’agit de l’un des 
motifs de liaison aux proteines les plus largement distribues parmi les 
genes du developpement. Ils participent a la formation des axes de 
symetries antero-posterieure et dorso-ventrale du corps. En specifiant 
l’identite des differentes regions du corps, les genes HOX determined 
le site de formation des membres et autres segments du corps chez 
l’embryon ou la larve. Des mutations dans Fun de ces genes condui- 
sent a la formation d’ appendices sur-numeraires non fonctionnels 
chez les invertebres. C’est le cas notamment de mutations dans le 
complexe aristapedia chez la drosophile. Ces mutations provoquent 
sur la tete, la formation d’une patte a la place d’une antenne (mutation 
connue sous le nom d’Antennapaedia). 

Les genes a homeoboites ont ete tout d’abord identifies chez les 
animaux a symetrie bilaterale. Certains genes de Cnidaires, un groupe 
animal tres primitif, possedent egalement des domaines a homeoboites, 
ce qui au-dela d’apporter le chainon manquant dans revolution des 
etres vivants, apporte une preuve supplemental sur la maniere dont 
procede F evolution pour faire du neuf a partir du vieux, tout en 
conservant ce qui « marche ». 

Les genes homeotiques des plantes - les genes a boites MADS - ne 
sont pas homologues des genes HOX animaux. Plantes et animaux ne 
partagent done pas les memes genes homeotiques, ce qui suggere que 
les genes homeotiques sont apparus deux fois au cours de revolution. 

La regulation des genes HOX s’avere tres complexe. Elle implique 
des interactions reciproques pour la plupart inhibitrices. 

Les genes du developpement 

Tous les animaux debutent leur vie sous la forme d’une cellule unique, 
et pour cette raison, Fembryon s’auto-organise au cours du develop- 
pement pour donner naissance aux nombreux types cellulaires differents, 
trouves chez Fadulte. L’ auto-organisation implique une serie d’inter- 
actions geniques qui assemblent les cellules d’une maniere qui prefigure 
le plan du corps adulte. Des evenements de remodelage redistribuent 
les cellules en tissus specifiques, et l’expression de batteries de genes 
indispensables aux fonctions cellulaires specialisees dirige ensuite 
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les processus de differenciation. Le fagonnage embryonnaire et la 
differenciation finale sont integres par de vastes reseaux de regulation 
genique qui controlent par exemple les divisions asymetriques ou la 
signalisation entre cellules, grace a des combinaisons de facteurs de 
transcription qui stimulent ou repriment leurs genes cibles en se liant 
aux sequences cfs-regulatrices. Si les genes cibles codent eux-memes 
des facteurs de transcription, ils controleront alors d’autres genes 
cibles si bien que le developpement peut se comparer a un vaste reseau 
Iranscriptionnel ou 1’ information m-regulatrice serait la composante cle 
(voir chapitre 5, les reseaux de regulation, et ENCODE). 

La notion d'homeoboite 

Une homeoboite est une courte sequence d’ ADN localisee au sein d’un 
gene implique dans la regulation du developpement des animaux, 
champignons et plantes. Ces genes sont nommes, pour cette raison, 
« genes a homeoboites ». Ils forment la famille des genes homeotiques. 

La sequence ADN d’une homeoboite possede environ 180 paires de 
bases et code un domaine proteique (rhomeodomaine) qui se lie a 
d’autres sequences d’ADN, d’ou le nom generique de proteines de 
liaison a l’ADN. Les genes homeotiques codent en general des facteurs 
de transcription qui activent a leur tour la transcription d’autres genes 
qui participent aux cascades necessaires a la formation d’une patte, par 
exemple. La proteine contenant une homeoboite se fixe a sa cible ADN 
d’une maniere specifique. Habituellement cela ne suffit pas cependant 
pour qu’une proteine possedant une seule homeoboite reconnaisse 
specifiquement son gene cible. Les proteines a homeodomaines agissent 
en effet generalement sous la forme de complexes avec d’aulres facteurs 
de transcription, eux-memes contenant des homeoboites, pour se lier a la 
region promolrice de leurs genes cibles. Ces complexes ont des specifi- 
cites beaucoup plus elevees qu’une seule proteine a homeodomaine. 

La notion de morphogene 

Cette notion ancienne ne designe pas une categorie particuliere de 
biomolecules, mais plutot une substance qui controle la maniere dont 
se developpe un tissu et comment se positionnent les differentes 
cellules specialisees qui le composent. Un morphogene diffuse gene- 
ralement a partir d’une cellule emettrice. II forme un gradient de 
concentration au sein du tissu cible en developpement. Cette notion a 
ete popularisee, il y a une cinquantaine d’annees, par Lewis Wolpert 
qui a decrit comment un morphogene subdivisait un tissu en domaines 
cibles de Y expression de differents genes, un peu a la maniere des 
couleurs d’un drapeau. Le premier morphogene a etre identifie fut un 
facteur de transcription dont le gradient, dans l’embryon syncitial de 
drosophile, participe a la definition de l’axe antero-posterieur de 
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l’animal (voir plus loin). Un autre morphogene, homologue duTGF(3, 
nomme chez la drosophile Decapentaplegic (Dpp), fut ensuite identifie. 
II agit aux stades tardifs du developpement embryonnaire de la mouche. 

Les gradients de morphogenes engendrent, au cours du develop- 
pement de la mouche, differents types cellulaires. Ils fagonnent 
F organisation spatiale de l’embryon. Le morphogene subdivise, par 
l’effet d’un gradient de concentration, un champ de cellules a qui il 
fournit de ce fait une information spatiale qui induit ou maintient les 
mecanismes moleculaires de 1’ expression de differents genes cibles 
sensibles a differents seuils de concentration (Fig. 7.3). 



Activation des 
recepteurs 





Niveau d’activation 
des facteurs 
de transcription 
dans le noyau 



Niveau 

de transcription 
des genes cibles 



Figure 73 Un cluster de cellules libere une molecule de signalisation, le morpho- 
gene, qui diffuse vers les cellules cibles a travers la matrice extracellulaire. 

Selon leur position plus ou moins distante du massif cellulaire emetteur, les cellules 1 , 2 et 
3 re^oivent des quantites differentes de morphogene. Le nombre de recepteurs de surface 
qui seront actives varie avec la distance et par voie de consequence, les cellules 
contiendront de moins en moins de proteines regulatrices (facteurs de transcription par 
exemple) dans leur noyau. Une correlation lineaire peut ainsi s'etablir entre la quantite 
de morphogenes lies par les recepteurs et le niveau de transcription des genes cibles. 
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Les cellules, les plus eloignees de la source de morphogene, rece- 
vront une faible concentration de morphogene et exprimeront les seuls 
genes sensibles a ce faible niveau. Au contraire, les cellules les plus 
proches de la source seront au contact de fortes concentrations de 
morphogene et exprimeront les genes sensibles a toutes les concentra- 
tions faibles et fortes. Differentes cellules seront ainsi conduites a se 
differencier, en reponse a des combinaisons de morphogenes de 
concentrations tres variees. Le champ initial de cellules, se subdivisera 
en differents types cellulaires, suivant la position des cellules vis-a-vis 
de la source de morphogene. II s’agit la d’un mecanisme general, 
responsable de la diversite des types cellulaires engendres au cours du 
developpement d’un animal. Les morphogenes les mieux connus sont 
des facteurs de transcription, mais la plupart sont des proteines secre- 
tees qui activent des voies de signalisation croisees entre les cellules 
cibles (voir Mini Manuel de Biologie cellulaire, chapitre 4). 

Le modele historique de la drosophile 

Tous les animaux actuels sont organises suivant des axes de symetries 
antero-posterieure et dorso-ventrale qui temoignent en quelque sorte 
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Gradient de orthodenticle 


Gradient de Hunchback 


Figure 7.4 Exemple de I'intervention d'un gene a effet maternel, le gene Bicoid, 
dans la formation de I'axe de symetrie antero-posterieure de la mouche. 

a. Le gradient de la proteine bicoid, un facteur de transcription, engendre differents 
niveaux d'expression des genes cibles, orthodentide et hunchback.Seules de fortes con- 
centrations de bicoid stimulent orthodentide dans la tete de I'embryon. Hunchback est 
stimule par des concentrations elevees et moyennes de bicoid, dans la tete et le thorax. 
Les deux genes possedent des sites ADN regulateurs en 5' (« enhancers ») qui fixent la 
proteine bicoid et stimulent la transcription du gene en aval. Mais les trois sites « enhan- 
cers » de chacun des genes n'ont pas la meme affinite pour bicoid. Les sites de ortho- 
dentide sont de faible affinite alors que les sites de hunchback sont a haute affinite. 
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Gradient de orthodenticle Gradient de Hunchback 

b. Dans les parties centrales de I'embryon, le gene orthodenticle n'est pas stimule 
car la concentration de la proteine bicoid n'est pas suffisante pour qu'une liaison 
avec les sites en 5'de faible affinite se produise. Pour hunchback c'est le contraire, 
car la concentration de bicoid est suffisante pour que la proteine se lie avec les sites en 
5'de haute affinite du gene. Les proteines orthodenticle et hunchback sont aussi des fac- 
teurs de transcription qui controlent avec des effets de gradients (indiques en noir 
grise) d'autres genes du developpement qui participent a leur tour par leurs produits 
au fa^onnage de I'embryon de la mouche. 


de la reussite complete au cours de 1’ evolution d’un type d’ organisation 
base sur un plan de symetrie bilaterale et une segmentation polarisee 
(Fig. 7.4, Fig. 7.5 et 7.6 ) dont le fagonnage est controle par des genes 
tres particuliers. Ainsi, les produits des genes a effet maternel, ARNm 
ou proteines, sont synthetises dans les tissus matemels entourant 1’ ovule 
(cellules folliculaires) puis importes dans ce dernier ou, en associa- 
tion avec les produits des genes embryonnaires homologues, leur 
distribution spatiale fagonnera le plan du futur embryon et de l’adulte, en 
activant les reseaux de genes appropries. Le decryptage des principaux 
mecanismes genetiques a l’origine du fagonnage precoce de I’embryon 
de la drosophile (mouche du vinaigre) constitue l’une des plus belles 
decouvertes de la genetique du developpement. 

Le developpement de Drosophila melanogaster commence par une 
serie de treize divisions nucleates qui ne sont pas accompagnees par 
la formation de cellules. L’embryon reste en effet une cellule unique 
avec 8000 noyaux disposes pres de la membrane jusqu’ a la 14 e division. 
A ce stade les membranes apparaissent et isolent les noyaux en cellules 
distinctes. Les facteurs de transcription, comme bicoid ou hunchback, 
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Figure 7.5 Exemplede I'intervention destrois genes sog, rhomboid extwist, dans 
la formation de I'axe de symetrie dorso-ventrale de I'embryon de mouche. 

Dans le cytoplasme syncitial (nombreux noyaux en I'absence de cellules) de I'embryon, 
la proteine Dorsal, un facteur de transcription, est fortement concentree en partie dorsale 
et faiblement en partie ventrale. Par contre dans les noyaux c'est I'inverse, la proteine 
Dorsal est concentree dans les noyaux de la partie ventrale et faiblement representee 
dans ceux de la partie dorsale. Les deux sites regulateurs en 5' du gene twist ont une 
faible affinite pour Dorsal et ne sont occupes que pour les fortes concentrations de 
Dorsal dans les noyaux de la partie ventrale. Un seul des sites en « cluster » 5'du gene 
rhomboid possede une haute affinite pour Dorsal de sorte que ce gene n'est stimule 
que dans les parties ventrale et laterale de I'embryon oil la proteine Dorsal est assez 
bien representee dans les noyaux. Les quatre sites introniques a haute affinite du gene 
sog peuvent lier la proteine Dorsal a toutes les concentrations nucleates, ce qui a pour 
consequence que ce gene est stimule dans toutes les regions laterales de I'embryon 
ou Dorsal est presente. 
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diffusent entre les noyaux et agissent comme des morphogenes, en 
produisant des gradients de concentration, sans le secours de voies de 
signalisation specialises qui sont habituellement necessaires pour 
obtenir ce type d’effet. Dans ce dernier cas, les proteines s’attachent aux 
domaines extracellulaires des recepteurs transmembranaires et trans- 
ferent, par un signal approprie, la concentration du morphogene au noyau 
(Fig. 7.4 et Fig. 7.5). 

Un lien direct s’etablit alors avec les facteurs de transcription qui 
controlent l’expression des genes. Les morphogenes secretes engendrent 
des gradients de concentration auxquels repondent les genes cibles 



Figure 7.6 Exemple du controle de I'expression du gene eve participant a la 
segmentation du corps de I'embryon de drosophile. 

La sequence codante de eve est assez courte, mais le gene lui-meme possede des 
regions regulatrices de grande dimension (12 kpb), composees de sites localises a la 
fois en 5' et en 3' de la region codante. La region 5' possede deux stimulateurs 
(« enhancers »), d'une taille de 500 pb chacun, qui controlent I'expression du gene 
dans differents groupes de cellules disposees en forme de bandes (les bandes 2, 3 et 7) 
a la surface de I'embryon. La region regulatrice en 3' possede trois stimulateurs qui 
controlent I'expression du gene eve dans les bandes de cellules 1 , 4, 5 et 6. Au total, les 
cinq stimulateurs produisent sept bandes d'expression cellulaire du gene eve qui avec 
d'autres genes contribuent a la formation des sept parties segmentees du corps de 
I'embryon de drosophile. 
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selon le niveau de concentration auxquels its sont sensibles. Le processus 
depend du controle opere par les motifs ADN regulateurs qui sont 
disposes generalement en amont 5’ (parfois en 3’ egalement) des genes 
cibles et qui fixent avec des degres d’affinite variable les facteurs de 
transcription regulateurs. Ces mecanismes generaux aboutissent a la 
differentiation de territoires cellulaires distincts ( Fig. 7.6). Ces derniers 
sont eux-memes a l’origine des tissus, organes et membres du futur 
organisme adulte. Cependant, de nombreux mecanismes additionnels 
restent encore a decouvrir dans le vaste champ de la biologie et de la 
genetique du developpement. 

7.4 D'OU VIENT LA NOUVEAUTE 

EN MATIERE DE DEVELOPPEMENT ? 

Parmi toutes les donnees relatives a la genetique du developpement, 
l’une des plus surprenantes se rapporte a la diversite phenoty pique 
(morphologique) des organismes appartenant a de nombreux phyllums, 
diversite qui ne se reflete pas exactement dans la diversite de sequences 
geniques qui restent tres souvent, malgre les distances phylogenetiques, 
etroitement apparentees, y compris pour des genes qui ne sont pas 
directement lies au developpement. Des la formation des premiers 
genomes dans un monde ARN (voir plus haut), les mecanismes a 
l’origine des changements de sequences reposent sur des transpositions 
et des recombinaisons d’ exons, realisant un veritable brassage d’un 
petit nombre de modules seulement. D’autres changements, bases sur 
des mecanismes de duplications et de mutations ponctuelles, elargissent 
le champ des possibles, mais toujours a partir d’un nombre finalement 
assez restreint de modules genetiques dont les assemblages au cours 
de 1’evolution ressemblent a un complexe jeu de meccano. A partir de 
quelques pieces de base, des constructions aux fonctions tres diversifies 
se realisent dans une sorte de bricolage geant et patient, a l’echelle de 
millions d’annees, soumis a une selection aleatoire, et dont les traces 
sont deposees sous la forme de fossiles dans les couches geologiques. 

Entre le genome humain (environ 20000 genes) et celui du nematode 
( 1 9 000 genes), un petit ver rond d’un millimetre de long, compose de 
954 cellules, la genomique comparee a etabli 1’ existence d’ homologies 
de sequences codantes avoisinant les 36 % ! Avec la souris et certains 
autres mammiferes, les homologies atteignent 80 %, et avec le 
chimpanze, pres de 99 %. 

D’ou pro vient alors la nouveaute, puisqu’elle ne se constate pas 
dans les genomes, au final si remarquablement apparentes ? 

Ne residerait-elle pas dans des changements, interessant la regulation 
de 1’ expression des genes et non dans les genes eux-memes ? (Voir 
chapitre 5, reseaux de genes et ENCODE.) 
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L'evolution de I'expression genique 

Une grande part de la biodiversite ne serait done pas la consequence 
de differences, pourtant bien reelles, presentes dans les genes homo- 
logues des diverses especes, mais plus concretement de changements 
evolutifs intervenus dans la regulation de ces memes genes. Ce type 
de changement, decouvert recemment, induit en effet de fortes conse- 
quences sur le fonctionnement des reseaux de genes (voir chapitre 5) et 
beaucoup moins dans celui des genes pris individuellement. L’exemple 
des genes HOX (voir Fig. 7.2 ) montre - au-dela de differences pheno- 
typiques entre les vertebres et les invertebres, differences liees a la 
duplication des genes et a la formation de « clusters » chez les premiers - 
que ce sont des modifi cations dans la regulation de leur expression, a 
la fois dans le temps et dans 1’espace, qui sont les plus pertinentes 
pour comprendre revolution des mecanismes genetiques entre les orga- 
nismes consideres. Les changements intervenant dans les regulateurs 
operant en cis notamment, sont beaucoup plus pertinents, que les 
changements dans le nombre de genes ou la fonction des proteines. 
Ces changements de niveau, de profil etde rythme dans I’expression des 
genes, foumissent finalement plus d’ opportunity a la selection naturelle 
que les seules mutations dans les produits des genes eux-memes. 

La regulation en cis et en trans de I'expression genique 

La regulation en cis designe la regulation qui depend des sequences 
ADN regulatrices de I’expression d’un gene, quelles que soient leurs 
localisations. La regulation en trans designe tous les facteurs proteiques 
ou ARN qui exercent leur fonction regulatrice en se liant notamment 
aux elements de sequences en cis (voir chapitre 5, ENCODE). 

Les changements par mutation qui ont des effets regulateurs 
marques sur I’expression genique au cours de revolution s’observent 
aux niveaux des sequences stimulatrices (enhancers), des facteurs de 
transcription, des sequences promotrices, et de divers autres elements 
impliques ou non dans la transcription. Les stimulateurs (enhancers) 
sont souvent cites comme etant les composants les plus pertinents. 
Une de leurs caracteristiques cles reside en effet dans leur aptitude a 
modifier de fa^on specifique l’activite d’un ou de plusieurs genes. De 
plus, leur structure modulaire (Fig. 7.4 , 7.5 et 7.6) et la nature combi- 
natoire de leur mode operatoire, sont des caracteristiques tout a fait 
adaptees a la genese de la diversite fonctionnelle. Cependant ces 
proprietes ne sont pas uniquement celles des stimulateurs. D’autres 
sites regulateurs, non transcriptionnels, presentent egalement des 
caracteristiques similaires. C’est le cas, par exemple, des sites localises 
dans les 3’ UTR. Ils regulent la traductibilite des transcrits. C’est le cas 
aussi des sites introniques et exoniques qui controlent les mecanismes 
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d’ epissage alternatif et sont a l’origine de la diversite des transcrits. 
C’est le cas enfin des sites de liaisons pour les ARN non-codants 
(microARNs et longs ARN) regulateurs qui interviennent dans la 
transcription, la stabilite des ARNm et leur traductibilite (Fig. 7.7). 

Nombreux sont les sites de regulation qui affectent les fonctions 
des genes du developpement d’une maniere independante des 
« enhancers ». Les genes sont en effet transcrits par des machineries 
biochimiques complexes dont le recrutement depend d’ interactions 
entre la chromatine et des elements modulaires qui controlent la 
transcription (enhancers et silencers). Ces interactions moleculaires 
peuvent etre modifiees par d’autres elements comme les isolateurs 
(voir chapitre 5). Des elements de sequences au niveau des promoteurs 
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Figure 7.7 Schema recapitulatif des niveaux ou s'exerce une regulation en c/s et 
en trons de Texpression genique. 
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ainsi que des facteurs additionnels specifiques de tissus participent au 
processus de demarrage de la transcription et contribuent a la cine- 
tique de ce demarrage. Au niveau de la transcription, les enhancers ne 
sont done pas les seuls elements qui influencent ce processus. Mais ce 
n’est que le debut. Les transcrits ARN sont modifies, au cours de leur 
transcription et la nature de ces evenements (epissage, « capping », 
polyadenylation, epissage croise, etc.) a une enorme influence sur la 
qualite et la quantite des ARN messagers matures. Ces derniers sont 
par ailleurs soumis a des systemes de controle qualite/degradation 
puis exportes du noyau selon un processus lui aussi objet de divers 
controles. Certains messages possedent des sequences particulieres 
qui definissent leur localisation subcellulaire ou ils seront finalement 
traduits. Les modules localises dans les UTRs affectent les cinetiques 
de traduction et la demi-vie de ces messages. Une fois la proteine 
synthetisee, d’autres processus regulateurs interviennent, comme la 
phosphorylation, la glycosylation, l’ubiquitinylation et la sumoyla- 
tion. La vitesse et le rythme de ces evenements regulateurs qui affec- 
tent la fonction de la proteine et sa demi-vie sont modules eux-memes 
au cours du developpement par des genes specifiques (Fig. 7.7). 

Estimation simplifiee de la faille moyenne 

des sites regulateurs mutables pour un gene standard 

v 

A la question de savoir : quelles sont les tallies respectives des sites 
transcriptionnels et non transcriptionnels dont les mutations peuvent 
avoir des effets sur la regulation de 1’ expression d’un gene et par 
voie de consequence imposer des changements evolutifs majeurs si 
la selection naturelle s’exerce positivement, un calcul simple permet 
de repondre. 

Taille moyenne des sites regulateurs transcriptionnels 

Les calculs sont bases sur l’hypothese qu’un gene possede en moyenne 
sept modules stimulateurs independants, chacun d’eux contenant dix 
sites de liaison pour des facteurs de transcription. Chaque site de liaison 
d’un facteur de transcription se compose de six paires de bases, une 
paire seulement n’etant pas specifique de la liaison. Avec ces donnees, 
le calcul donne : 

> nombre de stimulateurs : 7 ; 

> nombre de sites de liaison pour les facteurs de transcription par 
stimulateur : 10 ; 

> taille d’un site : 5 pb (6 dont 1 non specifique). 

Soit une taille totale moyenne de 350 pb (7 x 10x5) pour la region 
stimulatrice mutable regulant 1’ expression d’un gene. 
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Taille moyenne des sites regulateurs non transcriptionnels 

Les calculs pour estimer les dimensions des autres sites mutables regula- 
teurs de F expression des genes sont bases sur les longueurs moyennes 
de la sequence minimale liee par 1’ARN polymerase et du signal 
consensus de polyadenylation (AATAAA), sur la longueur et le nombre 
de sites d’epissage pour un gene moyen possedant quatre exons et trois 
introns. On admet la presence de cinq stimulateurs d’epissage par exon 
avec une longueur moyenne de six nucleotides soit la longueur moyenne 
des sites de liaisons de nombreuses proteines liant l’ARN. La longueur 
moyenne des modules regulateurs de 3’ et 5’ UTR sont conformes aux 
donnees de la litterature. Sur ces bases, le calcul donne : 

> promoteur minimal (boite TATA, initiateur, motif stimulateur de 
l’ARN polymerase) : 35 pb ; 

> signal de polyadenylation : 6 pb ; 

> sites accepteurs d’epissage : 3 pb x 2 = 6 pb ; 

> sites donneurs d’epissage : 3 pb x 2 = 6 pb ; 

> sites stimulateurs d’epissage : 6 pb x 20 = 120 pb ; 
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Figure 7.8a Deux scenarios montrant comment des mutations de sites regulateurs 
de I'expression de genes sont selectionnables au cours de 1'evolution. 

Une premiere mutation (mutation 1) intervient dans un site exonique d'epissage en 3' 
(exon 1 du gene A). La nouvelle proteine A presente une sequence peptidique modifiee 
comparee a la proteine A de type sauvage, mais le phenotype qu'elle influence s'en 
trouve f avorise par la selection naturelle. Pourtant le niveau d'expression de la nouvelle 
proteine n'est pas optimal et une pression de selection s'exercera pourqu'une deuxieme 
mutation au temps t 2 se produise dans un autre site regulateur ou dans un facteur 
proteique.transcriptionnel ou non. Ici, I'exemple retenu est celui d'une mutation 2 dans 
un site regulateur transcriptionnel en cis dont la consequence sera de stimuler la trans- 
cription du gene A mute au temps t v 
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Figure 7.8 b Deux scenarios montrant comment des mutations de sites regulateurs 
de I'expression de genes sont selectionnables au cours de 1'evolution. 

Une premiere mutation (mutation 1) intervient au temps t, dans un facteur agissant en 
trons. Cela peut etre un facteur de transcription comme retenu ici, mais aussi un facteur 
agissant par exemple sur la stabilite du messager du gene 2, avec pour consequence 
d'exercer un effet legerement negatif sur le gene 1,et au contraire un effet legerement 
positif sur le gene 2, pas completement decisif cependant en terme d'avantage selectif. 
Une deuxieme mutation (mutation 2) au temps t 2 dans un site regulateur stimulateur de 
la transcription du gene 2 contribuera a rendre optimal le niveau de transcription de ce 
geneet I'avantage selectif qui I'accompagne.On observera ici que les deux mutations ne 
sont probablement pas lieesla premiere mutation peut done etre perdue lors d'un evene- 
ment de recombinaison ou par segregation, ce qui eliminera son effet negatif sur le gene 1 . 


> modules regulateurs en 5’ (IRES) : 30 pb ; 

> modules regulateurs en 3’ (HSP 83, (3-actine) = 247 pb. 

Soit une taille moyenne totale de 450 pb (35 + 18 + 120 + 30 + 247) pour 
les sites mutables non transcriptionnels regulant I’expression d’un gene. 

Ces estimations montrent que les tailles respectives des sites regu- 
lateurs mutables sont comparables qu’ils soient transcriptionnels ou 
non transcriptionnels. Elies montrent finalement que, comparativement 
aux sequences codantes, V impact des mutations des sites regulateurs 
de I’expression des genes peut jouer un role majeur dans les chan- 
gements evolutifs a l’origine de la biodiversite des processus develop- 
pementaux (Fig. 7.8). On notera que les signaux de phosphorylation, 
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d’ubiquitinylation etde sumoylation, de retention nucleaire, d’adressage 
aux organites, les signaux peptidiques et autres signaux regulateurs 
n’ont pas ete pris en compte. 

Modifications epigenetiques de ('expression genique 

Les modifications epigenetiques de la regulation de l’expression des 
genes et de la formation des phenotypes accompagnees secondairement 
par des mutations geniques constituent une autre classe de mecanismes 
generateurs de nouveautes evolutives en matiere de developpement 
(voir chapitre 5, et aussi le Mini Manuel de Biologie moleculaire). 
Certains biologistes considered qu’en favorisant l’explosion des formes 
et des plans d’ organisation caracteristiques d’une macroevolution 
intense, ce type de changements a pu jouer un role majeur au debut de 
l’histoire evolutive des organismes multicellulaires. 

Une evolution de type lamarckien est-elle possible ? 

On savait que 1’ aptitude a perce voir des odeurs etait une force propul- 
sive de 1’evolution. En effet la capacite a reconnaitre differentes 
odeurs est importante pour la survie d’une espece. Elle rend les indi- 
vidus capables de fuir les predateurs, de trouver les ressources 
alimentaires, de se proteger des aleas de l’environnement comme 
d’etablir des liens sociaux et de choisir le partenaire d’accouplement. 
Par exemple la reaction d’effroi des rongeurs perce vant l’odeur de 
1’ urine de renard est une donnee bien connue. On suspectait que cette 
sensibilite selective avait ete engendree au cours de 1’ evolution par la 
selection naturelle de variants de genes codant les recepteurs de 
1’ olfaction. On ignorait que d’ autres mecanismes adaptatifs avaient pu 
jouer, independamment de l’ADN, un role dans F acquisition de cette 
olfaction selective. Une preuve experimentale acquise recemment 
semble pourtant apporter une reponse positive a cette question. 

On sait que chaque neurone olfactif de F epithelium nasal exprime 
un seul des nombreux membres de la famille des genes de F olfaction. 
Ainsi l’odeur de F acetophenone (une molecule aromatique a odeur de 
fleur de cerisier) est reconnue par le recepteur 01frl51. En associant 
la perception de cette odeur a de faibles mais traumatisants chocs 
electriques (Fig. 7-9), des chercheurs ont reussi a conditionner des 
souris qui manifesteront une reaction d’effroi a l’odeur de l’acetophe- 
none. Pour controler cette experience, ils utilisent le propanol, 
reconnu par le recepteur 01fr6. 

Ils observent que l’hypersensibilite des souris aux generations 
suivantes FI et F2 se manifeste a la seule odeur de F acetophenone, 
mais qu’elles restent insensibles a l’odeur du propanol. L’inverse est 
observe quand le meme conditionnement est realise avec le propanol 
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Figure 7.9 Heredite epigenetique transgenerationnelle d'un conditionnement 
associant la perception d'une odeuret la peur. 

Les descendants d'une souris conditionnee,en associant la perception d'une odeur a 
des chocs electriques desagreables, manifesteront aux generations ulterieures une 
reponse d'effroi accrue a la seule odeur de la substance odoriferante (ici I'acetophe- 
none) utilisee pour le conditionnement. Bien que le mecanisme exact ne soit pas 
encore connu, il pourrait resulter de la liberation de molecules circulantes telle que des 
micro-ARNs ou des glucocorticoides qui cibleraient, en provoquant son hypomethyla- 
tionJ'ADN des spermatogonies,au locus du gene codant le recepteurOlfrISI de I'ace- 
tophenone, ainsi que d'autres genes participant dans le cerveau au circuit neuronal 
responsable de la reaction de peur. Quand le sperme d'un male FI (il presente une 
reaction d'effroi en presence d'acetophenone) feconde une souris naive, le profil 
d'hypomethylation de I'ADN, maintenu dans les ovules fecondes,dirigerait la differen- 
ciation du circuit physiologique responsable de I'effroi. La progeniture F2 developpera 
a son tour un circuit neuronal entrainant une reponse d'effroi a I'acetophenone, simi- 
laire a celui de FI, grace a I'information epigenetique apportee par le sperme. 


* 

au lieu de I’acetophenone. Etonnamment cette experience montre que 
la reponse conditionnee a une odeur peut etre transmise par les souris 
a leurs descendants et ceci aussi bien par la lignee germinale des 
males (Fig. 7-9) que par celle des femelles, ce qui suggere que I’ADN 
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du sperme ou de l’ovule semble capable de transmettre l’aptitude a 
percevoir une odeur comme desagreable. Les chercheurs ont observe 
que les sites CpG du gene Olfrl51 , mais pas ceux du gene Olfr6 sont 
demethyles lorsque les souris sont exposees a 1’ acetophenone et que 
cette signature epigenetique est transmise aux generations F 1 et F2 en 
echappant a l’effacement de ce type de marque, un phenomene connu 
par ailleurs pour d’autres genes lors du passage entre generations 
(voir chapitre 5, « Empreintes parentales »). La demonstration qu’un 
tel mecanisme epigenetique est bien reel s’avere d’autant plus 
convaincante que le transfert generationnel s’opere par fecondation in 
vitro (excluant de ce fait tout effet comportemental des parents) et que 
des modifications anatomiques du bulbe olf actif (accroissement cons- 
tate du nombre de recepteurs 01frl51) attestent bien que le transfert 
de la sensibilite a 1’ acetophenone concerne aussi les circuits neuro- 
naux de 1’ olfaction. 

La possibility, comme l’avait suggere les anciens tenants du 
lamarckisme, que des facteurs environnementaux puissent entrainer 
des adaptations phenotypiques transgenerationnelles en 1’ absence de 
selection genetique, n’est pas pourtant consideree comme fondee, en 
raison : 1 °) d’une absence d’exemples clairs appuyant cette hypothese 
et 2°) de notre totale ignorance de ce que pourrait etre un mecanisme 
explicatif d’une telle liaison, transmise via la lignee germinale (sper- 
matozoides et ovule), entre un f acteur environnemental et une modifi- 
cation stable du genome. Certes des donnees se sont accumulees 
depuis quelques annees sur le fait qu’en reponse a l’environnement 
des mecanismes epigenetiques peuvent modifier la fonction des genes 
dans le cerveau et certains tissus somatiques. Cependant jusqu’ici rien 
ne laissait supposer que ces mecanismes epigenetiques pouvaient etre 
actif s sur la lignee germinale, la rendant apte a transmettre aux gene- 
rations futures l’experience acquise au contact de facteurs de l’envi- 
ronnement. Bien que beaucoup de questions restent encore sans 
reponse les nouvelles donnees apportees par ces experiences appuient 
fortement l’hypothese d’une possible voie de communication entre le 
systeme nerveux central et les gametes (Fig. 7-9). Certains recepteurs 
de 1’ olfaction portes par les gametes pourraient etre des composants 
d’un tel mecanisme au meme titre que certains recepteurs hormonaux 
comme les recepteurs des glucocorticoides ou bien meme des micro- 
ARNs qui, circulant du cerveau aux gametes, cibleraient des 
sequences specifiques du genome. Sans que soit remis en cause le lent 
processus de la selection naturelle darwinienne, il pourrait bien se 
faire, que ponctuellement, les organismes aient acquis des meca- 
nismes de reponses, specifiques et rapides, a certains facteurs de 
l’environnement (odeurs, menaces, etc), pouvant etre transmises a 
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leurs descendants sans passer par le lent processus general de revolu- 
tion. De tels mecanismes seraient-ils actifs dans notre espece et 
contribueraient-ils a la rapide et etonnante evolution des phenotypes 
et comportements, observee dans les populations humaines ? 
Certaines idees concernant les mecanismes adaptatifs pourraient bien 
devoir etre revues dans l’avenir. 
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> devolution s'appuie sur le constat que les seuls individus qui survivent (qui 
sont selectionnes) sont ceux qui, dans un environnement changeant, sont 
les plus aptes a se reproduire parce qu'ils y sont les mieux adaptes. L'environ- 
nement exerce done un tri, une selection qui provoque une evolution en 
faisant apparaitre des adaptations. 

> On designe par le terme de macroevolution celle qui intervient au niveau 
de I'espece ou a un niveau superieur.Typiquement la macroevolution fait 
reference aux changements qui modifient I'embryogenese, les plans d'orga- 
nisation, les principales caracteristiques des individus et qui sont a la base 
de la phylogenie des grands groupes du monde vivant. 

> La microevolution par contre designe au sein d'une population des chan- 
gements evolutifs de moindre ampleur comme ceux qui sont relatifs a la 
frequence des alleles. 

> Les biologistes considered que macroevolution et microevolution sont liees 
par lefait que ('accumulation graduelle de petits changements entraine les 
changements de plus grande ampleur, meme si des sauts evolutifs rapides 
sont egalement visibles dans les traces paleontologiques. 

>- revolution du developpement biologique, ou en abrege I'evo-devo, se 
propose de comparer les processus developpementaux des organismes 
vivants (animaux et des plantes). Elle essaie de determiner les relations 
ancestrales qui existent entre les organismes et comment ces processus 
ont evolue. 

> L'evo-devo aborde I'origine et 1'evolution du developpement embryonnaire. 
Elle analyse comment les changements dans le developpement et les 
processus qui le dirigent ont produit de nouvelles caracteristiques biolo- 
giques. Elle s'interesse au role de la plasticite developpementale dans 
1'evolution et comment I'ecologie intervient dans ces phenomenes. 

> Le monde ARN est une hypothese resultant de I'idee que I'evenement le 
plus critique se rapportant a I'origine de la vie repose sur I'emergence 
d'une molecule autoreplicative, une molecule qui puisse a la fois se copier 
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elle-meme et muter c'est-a-dire evoluer pour accroitre I'efficacite de sa 
propre replication. 

> L'auto-organisation de I'embryon implique une serie d'interactions geni- 
ques qui assemblent les cellules d'une maniere qui prefigure le plan du 
corps adulte. Des evenements de remodelage redistribuent les cellules en 
tissus specifiques,et I'expression de batteries de genes indispensables aux 
fonctions cellulaires specialises dirige ensuite les processus de differen- 
ciation. 

> Le fa^onnage embryonnaire et la differenciation finale sont integres par 
de vastes reseaux de regulation genique qui controlent par exemple les 
divisions asymetriques ou la signalisation entre cellules, grace a des com- 
binaisons de facteurs de transcription qui stimulent ou repriment leurs 
genes cibles en se liant aux sequences c/s-regulatrices.Le developpement 
peut se comparer a un vaste reseau transcriptionnel ou I'information c/s- 
regulatrice serait la composante cle. 

> Les changements par mutation ont des effets marques sur I'expression des 
genes au cours de 1'evolution. Ms s'observent a plusieurs niveaux : sequences 
stimulatrices (enhancers), facteurs de transcription, sequences promotrices, 
et divers autres elements impliques ou non dans la transcription. 

> Les modifications epigenetiques de la regulation de I'expression des 
genes et de la formation des phenotypes constituent une autre classe de 
mecanismes generateurs de nouveautes evolutives en matiere de deve- 
loppement. 


QCM - QROC 

7.1 Le terme « evolution » signifie-t-il progres et amelioration ? 
Expliquer. 

7.2 Qu’est-ce que l’evo-devo ? 

7.3 Citer quatre mecanismes qui contribuent a 1’evolution des genes. 

7.4 Qu’est-ce qu’un morphogene ? 

7.5 Dans I’embryon de Drosophile, des sequences situees dans les 
3’ UTR sont responsables de la localisation des ARNm des genes 
bicoid et oskar respectivement aux poles anterieur et posterieur de 
I’embryon. Quel phenotype peut-on s’attendre a observer si a la suite 
de diverses constructions et operations de transferts moleculaires, les 
regions 3’ UTR sont echangees et qu’une femelle homozygote pour 
les deux genes mutants est obtenue ? 


Copyright © 2015 Dunod. 


230 


Chapitre 7 • Genetfque de / ' evolution etdu developpement des orgonismes 


7.6 Plusieurs genes, dits a effets maternels, interviennent dans la 
formation des axes de symetrie antero-posterieure et dorso-ventrale. Des 
femelles mutantes homozygotes pour certains de ces genes produisent 
des embryons avec des defauts de segmentation quel que soit le geno- 
type des derniers, mutant heterozygote ou homozygote (exemple du 
gene bicoid : bcd+/bcd ou bcd/bcd). Pour d’autres genes mutes, a effets 
maternels, la production d’un phenotype mutant peut etre evitee si un 
allele sauvage du gene considere est apporte par le pere. Comment 
peut-on expliquer la difference exercee sur le phenotype selon Tune 
ou 1’ autre des categories de genes a effets maternels. 

7.7 Les supports physiques des mecanismes regulateurs intervenant 
dans les relations de type « hierarchie de genes » et « reseaux de 
genes » sont-ils differents ? Expliquer. 

7.8 Donner un exemple de site regulateur transcriptionnel et non 
transcriptionnel. 


REPONSES 


7.1 Non. Les notions de superiority d’un genotype, d’un phenotype 
ou d’un organisme sur un autre sont etrangeres a la theorie de revolu- 
tion. Evolution ne signifie pas amelioration. Les notions cles sont les 
notions de variation, d’ adaptation et de selection au hasard. 

7.2 L’evo-devo essaie de determiner les relations ancestrales qui 
existent entre les organismes et de quelle maniere ces processus ont 
evolue. L’evo-devo aborde l’origine et revolution du developpement 
embryonnaire. Elle analyse de quelle maniere les changements dans 
le developpement et les processus qui le dirigent ont produit de 
nouvelles caracteristiques biologiques. Elle s’interesse au role de la 
plasticite developpementale dans 1’evolution et de quelle fa^on l’ecologie 
(l’environnement) intervient dans ces phenomenes. 

7.3 La mutation, le brassage, la transposition et la duplication. 

7.4 Un morphogene est une biomolecule qui intervient directement 
par son activite, souvent exprimee sous la forme d’un gradient spatio- 
temporel, dans la morphogenese d’un organisme. 

7.5 Une inversion de l’axe antero-posterieur. 

7.6 Les genes dits a effet maternels sont localises dans les cellules 
nourricieres de l’embryon et non dans l’embryon lui-meme qui ne 
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regoit que les ARNm ou les proteines correspondantes. Si le gene est 
mute, FARNm ne sera pas fonctionnel par defaut de localisation 
(voir 7.5) ou par inactivity de la proteine correspondante. La presence 
d’un gene nucleaire sauvage homologue, apporte par le pere evitera le 
phenotype mutant resultant pourvu que l’expression de ce gene s’effectue 
correctement a la fois dans l’espace (localisation du transcrit ou de la 
proteine dans la partie attendue de l’embryon) et dans le temps 
(expression au moment adequat de l’embryogenese). Les phenotypes 
lies aux genes a effets maternels mutes qui n’ont pas d’ homologue 
nucleaire fonctionnel ne seront pas evites. 

7.7 Non. Dans la majorite des cas, le fonctionnement des cascades 
regulatrices ou des reseaux regulateurs repose sur des elements cis- 
(motifs de sequences ADN) et trans-regulateurs (facteurs proteiques 
et ARN regulateurs) communs ou similaires. Les differences sont dans 
les modalites de mise en oeuvre (existence ou non de gradients, nombre 
de sites cA-regulateurs, affinite differentielle des sites, et surtout inter- 
actions croisees ou non des elements cis et trans-regulateurs). 

7.8 Les sites regulateurs transcriptionnels du gene eve et les sites 
regulateurs en 3’ UTR des transcrits de bicoid. 
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Genetique 
des populations 



8.1 Calculs des frequences genotypiques et alleliques 

8.2 Le modele de Hardy-Weinberg 

8.3 Applications aux alleles rares 

8.4 Parente et coefficient de consanguinite 

8.5 Moderation de la selection naturelle 



Aborder les premiers elements de genetique des populations 




> Aborder les calculs de frequences alleliques et genotypiques 


oo 

O 


> Aborder les bases du modele de Hardy-Weinberg 


En publiant en 1859 De I’origine des especes, Darwin exposait une 
theorie de 1’ evolution des especes par selection naturelle qui peut se 
resumer en trois principes : 

> le principe de variation : dans une population, il existe une variation 
entre individus et elle concerne leur morphologie, leur physiologie 
et leur comportement ; 

> le principe de l’heredite : les jeunes ressemblent plus a leurs 
geniteurs qu’a des individus auxquels ils ne sont pas apparentes ; 

> le principe de selection : certains individus sont plus aptes a survivre 
et a se reproduire dans un environnement donne. 

II en ressort que les populations naturelles se composent d’ individus 
genetiquement differents pour un grand nombre de genes et qu’il existe 
un polymorphisme genetique des populations. Confrontees aux modi- 
fications des facteurs environnementaux, ce polymorphisme constitue 
pour les especes un veritable capital adaptatif permettant leur survie. 

La genetique des populations s’efforce d’evaluer la diversite genetique 
et d’etablir des lois decrivant dans le temps et l’espace le maintien ou 
la modulation de la variation genetique au sein d’une population. Son 
point de depart est la recherche des differents alleles d’un gene dans 
une population concernee et l’analyse des frequences de ceux-ci. 
Pour un grand nombre de genes, F analyse du polymorphisme donnera 
une estimation de la diversite genetique globale rencontree entre des 
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Chapitre 8 • Genetique des populations 


indi vidus d’une meme population mais aussi entre des populations 
(Tableau 8.1). Jusqu’ici, les modeles theoriques de la genetique des 
populations (les lois) ne s’appliquaient correctement aux mecanismes 
responsables de la diversite genetique que pour un voire deux genes, 
rarement plus. Avec les progres des techniques de sequengage et 
d’ analyse des genomes entiers (GWAS : Genome-Wide Association 
Studies) la genetique des populations s’en trouve profondement 
renouvelee tout comme la gestion des populations humaines (epide- 
miologie des maladies anciennes et emergentes), animates et vegetates 
(gestion de la biodiversite). 

Tableau 8.1 Frequences des groupes sanguins MN dans diverses populations. 


Populations 

Frequences phenotypiques 
(ou genotypiques*) 

Frequences 
des alleles 

M/M 

M/N 

N/N 

p (M) 

q (N) 

Indiens americains 

0,60 

0,35 

0,05 

0,78 

0,22 

Blancs americains 

0,29 

0,50 

0,21 

0,54 

0,46 

Noirs americains 

0,28 

0,50 

0,22 

0,53 

0,47 

Esquimaux 

0,83 

0,16 

0,01 

0,91 

0,09 

Allemands 

0,30 

0,50 

0,20 

0,55 

0,45 

Chinois 

0,33 

0,49 

0,18 

0,57 

0,43 

Nigeriens 

0,30 

0,50 

0,20 

0,55 

0,45 


* Frequences phenotypiques et frequences genotypiques sont ici identiques parce qu'a chacun des 
genotypes correspond un phenotype parfaitement identifiable. 


Le systeme de groupe sanguin MN resulte de variations ponctuelles dans la sequence 
en acides amines de la partie N-terminale de la glycophorine A, proteine presente a la 
surface des erythrocytes. Les phenotypes sont mis en evidence a I'aide d'anticorps diri- 
ges contre le produit de I'un ou I'autre des deux alleles. L'antigenicite est determinee 
par le polymorphisme des acides amines 1 et 5. Pour I'allele M la sequence N-terminale 
de la glycoproteine est: Ser-Ser-Thr-Thr-Gly-Val-etc., et pour I'allele N : Leu-Ser-Thr- 
Thr-Glu-Val-etc. Pour une population donnee, la somme des frequences (phenotypi- 
ques ou alleliques) est bien evidemment egale a 1 . 

8.1 CALCULS DES FREQUENCES GENOTYPIQUES ET ALLELIQUES 

Pour un locus donne, la genetique des populations cherche a comprendre 
la relation entre deux variables etroitement liees : la frequence geno- 
typique et la frequence allelique ou genique. 

f (A) se dit frequence de I’allele A ou frequence allelique ; / (G)X se dit 
frequence genotypique pour x qui represente ici la combinaison des 
alleles A/A. 
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Les frequences genotypiques se calculent par le comptage des indi- 
vidus porteurs des differents genotypes possibles (voir par exemple 
Tableau 8.1). Ainsi, pour un locus ou deux alleles A et A’sont identifies, 
on pourra denombrer les individus diploides porteurs de l’un des trois 
genotypes A/A, A/A’et A’/A’. Les frequences genotypiques attribuables 
a chaque groupe d’ individus seront par exemple / (G)x , / (G)y et / (G)z 
respectivement. Generalement, ces frequences sont exprimees soit en 
pourcentage, leur somme etant alors egale a 100 ; soit en proportion, 
la somme egalant alors 1 . 

Connaissant les frequences genotypiques on peut calculer les 
frequences alleliques. Exemple : Pour calculer la frequence de 1’ allele A, 
on doit s’appuyer sur les frequences genotypiques des individus porteurs 
de 1’ allele A. Or la frequence de V allele A correspond a la probability de 
trouver T allele A chez un individu pris au hasard dans la population 
consideree. 

Pour determiner une frequence genotypique, on considere ici qu’a 
chacun des genotypes homozygotes (A/A et AVA’) ainsi qu’au geno- 
type heterozygote (A/A’) correspond un phenotype parfaitement 
identifiable. 

Si 1’ individu examine possede un genotype homozygote A/A, la 
probability de trouver 1’ allele A sera done maximale et egale a 1. 
Evidemment, cela n’est vrai que pour ce type d’individus. Aussi, faut-il 
tenir compte de leur representation dans la population, autrement dit 
de la frequence x du genotype dans la population, soit / (G)x . Pour cette 
partie de la population, on dira que la frequence allelique /(A) est 
egale a 1 x/ (G)x . 


Enfin, si l’individu examine possede un genotype A’/A’, la probability 
de trouver A sera nulle, corrigee en theorie par la frequence f (G) z des 
individus de genotype A’/A’, soit une frequence de V allele A pour 
cette partie de la population egale a f (A) = 0 x / (G)z . 

Pour 1’ ensemble de la population, la frequence ■f(A) ou p sera egale 
a la somme des frequences partielles, soit : 
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Si l’individu examine possede un genotype A/A’, la probability de 
trouver 1’ allele A sera evidemment de 1 sur 2, soit 0,5, qu’il faudra 
corriger par la frequence / (G)y correspondant aux individus de geno- 
type A/A ’dans la population. Pour cette partie de la population, on dira 


f 

que la frequence allelique f (A) est de 0,5 x f (G)y ou -—^2 
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Un raisonnement similaire amene pour la frequence f (A ) ou q de 
1’ allele A’ a: 

f (A’) = (° x /( ox) + (0^5 x / (G)y ) + ( 1 x / (G)Z ) = + / (G)Z = q ; 

la somme des frequences / (A) et / (A) etant bien evidemment egale a 1 , 
d’ou : 

f (A) + f (A') = p + q = •• 


8.2 LE MODELE DE HARDY-WEINBERG 

Dans une population d’individus diploides, differents genotypes 
peuvent coexister, c’est le polymorphisme genetique. Pour un gene 
donne, les frequences de ces genotypes / (G) evoluent au fil des gene- 
rations. Quand on peut les etablir a une generation donnee, est-il 
possible de les connaitre a la generation suivante ? C’est a cette question 
que s’efforce de repondre le modele mathematique ou loi de Hardy- 
Weinberg. 

Conditions requises pour ^application du modele 

Le modele ou loi de Hardy- Weinberg s’ applique a une population 
theorique formant une communaute d’individus qui ne se perpetuent 
entre eux que par la reproduction sexuee. 

La loi theorique est etablie dans le cas le plus simple en considerant 
un gene autosomique n’ayant que deux alleles possibles. Ceci exclut 
1’ existence de toute mutation qui ne ferait qu’accroitre le nombre des 
alleles. De plus ( Fig. 8.1) nous devons considerer que : 

> la formation des couples reproducteurs (1) s’opere au hasard, c’est- 
a-dire independamment des liens de parente et des genotypes. Ces 
couples sont dits panmictiques (on parle egalement de conditions 
de panmixie). II n’y a pas de selection au niveau des reproducteurs. 

> les deux types de gametes quel que soit leur genotype (leur allele 
respectif) ont la meme possibilite de participer a la fecondation (2). 

> les zygotes (3), quelle que soit la combinaison allelique (genotype) 
parmi les trois possibles, sont supposes avoir la meme probabilite 
de donner un individu (4). Pour le gene considere, aucun des trois 
genotypes n’influence l’esperance de vie (5) et tous les individus 
adultes a la generation suivante (n + 1 ) peuvent se reproduire. 

> enfin, la taille de la population doit etre suffisamment grande pour 
negliger les fluctuations aleatoires de la frequence des alleles. 
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Frequences genotypiques 
des adultes 


Frequences des divers 
assortiments de genotypes 
(d’alleles) a la meiose 


Frequences genotypiques 
a la naissance 


Figure 8.1 Modele general, applique en genetique des populations, entre les 
stades adultes reproducteurs de deux generations successives. 

Les chiffres entre parentheses indiquent les points critiques restrictifs qui sontdetailles 
dans le texte. 


Generalisation du modele de Hardy-Weinberg 

On considere une population constitute d’ adultes reproducteurs, a la 
generation n. Pourun gene autosomique diallelique (allele A et allele A’) 
trois genotypes possibles sont detectables : A/A, A/A’ou A’/A et AVA’ 
avec des frequences respectives / (G)x , / (G)y et / (G)Z . Si la frequence de 
l’allele A, / (A) ou p, est identique dans les deux types de gametes 
(spermatozoides et ovocytes), il en est de meme pour celle de l’allele A’, 
/ (A ) ou q, la somme des fequences des deux types gametiques (p + q) 
sera egale a 1 . Les unions au hasard des gametes lors de la feconda- 
tion dans une telle population panmictique (voir plus haut) peuvent se 
representer comme dans la figure 8.2. 

La probability que le gamete male (spermatozoide) et le gamete 
femelle (ovocyte) soient tous deux porteurs de 1’ allele A sera egale au 
produit (p x p) des frequences alleliques, soit p 2 . Cette valeur definit 
egalement la frequence genotypique / (G) x des homozygotes A/A a la 
generation suivante (n + 1). De meme, la frequence / (G)Z des homo- 
zygotes A ’/A ’ sera q x q = q 2 et celle des heterozygotes A/A ’(geno- 
types A VA et A/A ’) / (G)y sera (p x q) + (q x p) = 2 pq. 
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Spermatozoi'des 



A(p) 

A' (q ) 

A 

A/A 

A /A' 

(P) 

(P 2 ) 

(p q) 

A' 

A' /A 

A' /A’ 

(q) 

(q P) 

(q 2 ) 


Figure 8.2 Union au hasard des gametes lors de la fecondation dans une 
population panmictique. 


Ainsi, a la generation (n + 1), apres un croisement au hasard, les 
trois genotypes A/A, A/ A', AVA’ se repartissent respectivement selon 
les frequences genotypiques / (G)x = p 2 , / (G)y = 2 pq, / (G)z = q 2 . 

Si on applique la formule generate de calcul des frequences alleliques 
a partir des frequences genotypiques, presentee plus haut, on obtient a 
la generation (n + 1 ) pour : 

> la frequence de 1’ allele A : 

/(A)=/(G)X+^ = P 2 + =p(p + q) 

> la frequence de l’allele A’: 

/ ( A’)= /(G)z + ^ = q 2 + ^ = q (p + q) 

Or comme p + q = 1 , on retrouve pour les deux alleles A et A ’ les 
frequences p et q identiques a celles etablies a la generation precedente n. 
Cette stabilite de la frequence des alleles est appelee « equilibre de 
Hardy- Weinberg ». Elle requiert pour etre maintenue indefiniment les 
conditions suivantes : une population panmictique, de taille infinie, 
sans mutation pour les alleles consideres, et dans laquelle ne s’exerce 
aucune selection. Un dernier critere pour le maintien de 1’ equilibre est 
1’ absence de migration. 

Si les frequences alleliques / (A) = p et / (A > } = q demeurent stables, 
les frequences genotypiques / (G)x , / (G)y et / (G)z qui avaient a la genera- 
tion n des valeurs quelconques, determinees experimentalement, sont 
devenues a la generation (n + 1 ) respectivement p 2 , 2 pq et q 2 (voir 
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plus haut). Elies demeureront inchangees tant que les frequences 
alleliques p et q ne seront pas soumises a des variations. Cet etat 
d’ equilibre entre les frequences alleliques et genotypiques d’un gene 
autosomique est atteint, dans ces conditions restrictives un peu 
theoriques, en une seule generation. 

Mise en evidence de la relation entre equilibre allelique 
et equilibre genotypique 

Considerons deux populations PI et P2 ou ne sont representes que les 
2 alleles A et A’. Ces deux populations seront caracterisees a titre 
d’exemple, par les frequences genotypiques suivantes ( Tableau 8.2). 

Tableau 8.2 Frequence genotypiques de deux populations PI et P2. 


Genotype 

A/A 

A/A' 

A'/A' 

Frequence 

h G)X 

f(G)y 

f(G)z 

PI 

0,3 

0,2 

0,5 

P2 

0,1 

0,6 

0,3 


Les frequences parentales des alleles A etA’dans ces deux populations 
s’averent identiques et egales a 0,4 et 0,6 respectivement : 

> Population 1 : 

f ( A, = /«% + ^ = 0,3 + ^ = 0,4 

et /„•) =/( G)Z + f m. = 0,5 + ^ = 0,6 

> Population 2 : 

/ W = /( cx + % =0,1 + ^=0,4 

et/ (J , = / (a|J + ^L y =0,3 + ^=0,6 

Ainsi, bien que les frequences genotypiques different (voir tableau ), 
ces deux populations possedent les memes frequences alleliques : p = 0,4 
et q = 0,6. Apres une generation de panmixie, soit a (n + 1) les deux 
populations possederont cependant les memes frequences genotypiques : 

f (G)x - P 2 - (0,4) 2 = 0, 1 6 

f(G)y = 2 pq = 2 (0,4 x 0,6) = 0,48 

/( G)z = q 2 = (0,6) 2 = 0,36 

qui se maintiendront tant que p et q resteront constants. 
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8.3 APPLICATIONS AUX ALLELES RARES 

Jusqu’ici nous avons considere qu’il etait possible de determiner les 
frequences genotypiques d’apres l’observation du phenotype des 
individus. Ceci signifie que la combinaison des deux alleles du gene 
considere present chez 1’ heterozygote donne un phenotype aisement 
identifiable distinct des phenotypes des deux homozygotes. Nous 
avons done fait abstraction des caracteres dominants ou recessif s qui 
rendent impossible le calcul des frequences alleliques car, par 
exemple pour les deux genotypes ( A/A et A/a ) nous observerions un 
phenotype identique lie au caractere dominant (A). Le modele de 
Hardy- Weinberg permet cependant d’ avoir acces indirectement aux 
frequences alleliques si la population obeit bien a l’equilibre prece- 
demment decrit. Dans ces conditions, les frequences genotypiques / (G)x , 
f (G)y et f (G)z P our lesquelles on ne peut estimer, par V observation des 
deux phenotypes, que les valeurs | / (G)X + / (G)y ] et/ (G)z , se presentent a la 
generation (n + 1) comme suit ( Tableau 8.3) : 


Tableau 8.3 



Phenotype dominant 

Phenotype recessif 

Genotype 

A/A 

A/a 

a/a 

Frequence genotypique 

f(G)x=P 2 

f(G)y = 2 Pq 

Wq 2 


Le phenotype recessif ne peut provenir que d’ individus homo- 
zygotes portant les deux alleles a. La frequence d’ apparition de tels 
individus (q 2 ) dans une population est quantifiable par simple comptage. 

On en deduit la frequence allelique de 1’ allele a, f (a) = Jq 2 , sachant 
que p + q = 1 , on en deduit indirectement = p = 1 - q. A partir de 
la connaissance d’une des frequences alleliques (q), il s’avere done 
possible de representer la relation generate entre les frequences des 
differents genotypes, homozygotes et heterozygotes ( Fig. 8.3). Dans 
une population panmictique, on observe qu’un allele rare, e’est-a-dire 
dont la frequence est proche de 0, ne se maintiendra que grace a sa 
presence chez les individus heterozygotes. Cette observation possede 
un grand interet dans le cas de maladies genetiques recessives pour 
determiner dans une population le nombre de porteurs sains presents 
(voir chapitre 1). 
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Figure 8.3 Representation des frequences genotypiques observables dans une 
population a I'equilibre en fonction de la frequence allelique (q) de I'allele recessif a. 


Pour reprendre deux exemples deja decrits, Talbinisme et la phenyl- 
cetonurie, on observe les frequences suivantes dans la population 
frangaise ( Tableau 8.4 ) : 


Tableau 8.4 



Frequence 
de la maladie 
a la naissance* 

Frequence 
allelique Jq 2 

Frequence 
des porteurs sains 
2 pq ou 2q(1 -q) 

Albinisme 

1/10 000 

1/100 

1,98/100 

Phenylcetonurie 

1/16000 

0,8/100 

1,59/100 


* Frequence du phenotype ou genotype recessif q 2 


Le rapport individus porteurs sains/individus malades est egal a : 

les sou 2 q ( 1 -q> ou 2 ( 1 -q> 

q 2 q 2 q 

II montre que plus un allele est rare dans une population, plus la propor- 
tion d’ heterozygotes (porteurs sains) est superieure a celle des homo- 
zygotes (malades). Dans I’exemple ci-dessus, ce rapport est egal a 198 
dans le cas de Falbinisme (frequence allelique 1/100) et 254,4 pour la 
phenylcetonurie (frequence allelique 0,8/1 00). Autrement dit, plus ce 
rapport est eleve, plus la frequence de la mutation au locus respon- 
sable de la maladie est rare. 
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La meme demarche peut etre suivie pour les mutations responsables 
de maladies genetiques dominantes. Dans ce cas, la frequence F 
des individus malades inclut les heterozygotes et F a comme valeur : 

p 2 + 2 pq. La frequence de 1’ allele sain est q = J\-F et celle de 1’ allele 

mute, vecteur de la maladie, p = 1 - Jl - F. 

Ces calculs supposent une absence de selection ou d’ interventions 
exterieures comme c’est le cas chez l’homme en raison des progres de 
la medecine. II n’en demeure pas moins que la loi d’equilibre de 
Hardy- Weinberg reste un modele central a partir duquel il devient 
possible de suivre revolution d’une population (limite et vitesse des 
modifications) lorsque les conditions d’equilibre ne seront plus 
respectees. On peut voir ci-dessous le role de la consanguinite dans ce 
phenomene. 

8.4 PARENTE ET COEFFICIENT DE CONSANGUINITE 

Dans les populations naturelles, les accouplements aleatoires sont en 
general la regie, et la distribution des alleles a un locus donne reflete 
cette situation. Mais le phenomene n’est pas universel et les ecarts a la 
panmixie peuvent par exemple provenir d’ unions preferentielles entre 
individus apparentes. On parle d’endogamie ou consanguinite. En 
genetique, est dit consanguin le fils (la fille) issu(e) de 1’ union de deux 
individus genetiquement apparentes, c’est-a-dire ayant au moins un 
ancetre commun. 

Les termes : pere, mere, fils, fille, etc., s’appliquent egalement en 
genetique animale pour designer l’appartenance des animaux a telle 
ou telle generation. 

Dans les populations naturelles, l’endogamie peut etre la conse- 
quence d’un confinement geographique, de certains mecanismes de 
reproductions ou de caracteristiques de comportement. Dans les popu- 
lations fortement selectionnees, l’endogamie est un risque permanent. 
C’est le cas dans les elevages d’animaux de ferme, et le selectionneur 
doit veiller constamment a dejouer les consequences nefastes des 
accouplements entre individus apparentes. Bien que chez l’homme la 
consanguinite soit un tabou social, les unions entre individus sembla- 
bles (homogamie) pour certains caracteres (taille, couleur de la peau, 
etc.) sont communes. Une difference doit etre faite cependant entre 
1’ homogamie qui ne concerne qu’un caractere particulier, meme si 
quelques genes sont impliques, et l’endogamie qui concerne la totalite 
du genome. 

Le degre de consanguinite peut s’ exprimer par le coefficient de 
parente (r). II manifeste la probability qu’un ancetre ait transmis a ses 
deux descendants directs le meme allele parmi les deux distincts qu’il 
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possede a un locus donne. Pour un frere et une soeur, il sera de 0,5. 
Cette valeur represente la proportion de genome identique chez deux 
individus apparentes, consequence de leur ascendance commune. 
C’est pourquoi, ensuite l’accouplement de deux individus apparentes 
accroit la probability qu’un allele provenant d’un ancetre commun 
soit present chez les descendants ou il s’exprimera sous la forme 
homozygote. Ainsi, la consanguinite n’augmente pas la frequence des 
mutations, mais elle permet en revanche une augmentation de la 
proportion des individus homozygotes. La probability d’homozygotie 
par filiation est appelee coefficient de consanguinite (F). 


O 

C 

=3 

Q 

in 

T 1 

o 

Cvl 

© 



Figure 8.4 Le coefficient de consanguinite : probability d'homozygotie par filiation. 

La figure 8.4 materialise cette probability. Elle est de 0,5 pour que 
chaque individu (III et IV) regoive Fallele A/ de leur pere (I). De 
meme, elle est de 0,5 pour que cet allele A 7 soit transmis a leur propre 
descendant (V) consanguin, soit une probability de 0,25. Cette valeur 
exprime egalement la probability que V soit homozygote par fi liation. 
Une consanguinite aussi forte peut avoir des consequences desavanta- 
geuses lorsque Fallele est rare et qu’a l’etat homozygote il provoque 
une maladie. Si sa frequence p est de 1/1000, la frequence d’ apparition 
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d’ homozygotes de 1’ allele defectueux A, dans une population naturelle 
d’apres la loi de Hardy- Weinberg sera de p 2 soit 1/1000000 (voir 
exemple de la phenylcetonurie au chapitre I). Dans le cas d’un couple 
d’indi vidus apparentes (III) et (IV) dont Fun des parents (I) ou (II) est 
heterozygote (porteur sain), le risque que ce couple ait une descen- 
dance (V) homozygote augmente. Mathematiquement la probabilite 
diminue, elle correspond a la probabilite que (I) ou (II) soit hetero- 
zygote (frequence de F allele de 2 pq), qu’ils transmettent F allele rare 
defectueux A, a leurs deux descendants (III) et (IV) soit une probabilite 
de 0,5 et que (V) soit homozygote (probabilite de 0,25), ce qui donne : 

(2 pq + 2 pq) x 0,5 x 0,5 x 0,25 = ES 

4 

Comme q (frequence de F allele correct) est voisine de 1, la proba- 
bilite que le descendant (V) soit malade (homozygote pour F allele 
defectueux) sera de p/4 soit 1/4000. Si on compare la frequence d’un 
homozygote (p 2 ) dans une population naturelle panmictique, a celle 
obtenue suite a l’union consanguine entre individus directement 
apparentes (p/4), il en ressort une augmentation d’un facteur 250 soit 
(lx 10 6 )/(4 x 10 3 ) de la probabilite d’homozygotie pour F allele defec- 
tueux, soit un risque accru identique que le descendant manifeste la 
maladie genetique. 

De maniere plus generate, dans le cas d’unions consanguines, on 
peut ecrire que la frequence d’homozygotes pour un allele quelconque 
est de : 

p/4 = 1 
P 2 4 p 

L’homozygotie par fi liation decroit en fonction du degre de parente. 
Par exemple elle est de — pour des cousins au premier degre. 

16 p 

En favorisant les unions consanguines chez les animaux domestiques 
ou par autofecondation chez les vegetaux, c’est-a-dire en pratiquant 
l’endogamie systematique, l’eleveur peut, a partir d’une population 
heterozygote, en quelques generations « creer » une population homo- 
gene pour un phenotype par la fixation d’ alleles impliques dans le 
determinisme du caractere recherche. Cette demarche s’ applique en 
selection bovine ou, par exemple Fun des caracteres phenoty piques 
d’ identification d’une « race » est la couleur de la robe. 

8.5 MODELISATION DE LA SELECTION NATURELLE 

II faut se rappeler que la selection opere a partir du phenotype des 
individus. C’est parce que tel individu est plus apte a survivre et peut 
par consequent mieux se reproduire que son genotype se repandra au 
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sein de la population. Envisageons un modele dans lequel la selection 
naturelle des indi vidus s’ applique a un locus possedant deux alleles, B 
et B’ . La probabilite de survie de l’individu, de la naissance jusqu’a 
l’age adulte, varie en fonction du genotype. Considerons les probabilites 
de survie suivantes ( Tableau 8.5 ) : 

Tableau 8.5 Probability de survie en fonction des gYnotypes. 


Genotypes 

Probabilite de survie 

B/B 

1 

B / B ' 

1 

B'/B' 

1 -s 


On appelle coefficient de selection, s, une valeur comprise entre 0 
et 1 qui traduit la difference entre la plus faible aptitude de survie des 
individus homozygotes (B’/B’)’ jusqu’a l’age adulte et celle des indi- 
vidus possedant les genotypes les plus aptes ( B/B , B/B ’). Par exemple, 
si s = 0,2, cela signifie que le probabilite de survie ou aptitude a la 
survie des individus de genotype BVB’v aut 80 % de celle des individus 
B/B et B/B’. Au fil des generations, il y aura une dilution de 1’ allele B’ 
aboutissant a son elimination. On dira alors qu’il y a fixation de 
l’allele B. En genetique des populations, on considere qu’un allele est 
fixe lorsque sa frequence est de 1, c’est-a-dire que tous les individus 
sont homozygotes pour cet allele. La vitesse de variation de la 
frequence des alleles se determine en calculant la frequence p’ de B a 
une generation (n + 1 ) par rapport a la frequence p du meme allele a la 
3 generation precedente. 

r\J 

Ap = p’ - p represente la variation de la frequence allelique d’une 
generation a la suivante. La selection s’opere a la generation (n + 1) et 
elle modifie le nombre d’adultes dans la mesure ou les individus 
homozygotes (B’/B’) adultes sont moins nombreux qu’a la naissance. 
Les nouvelles frequences genotypiques sont done a calculer de telle 
maniere que leur total demeure egal a 1. Pour cela, il faut diviser 
chaque valeur de frequence par la somme des frequences relatives 
calculees ainsi : p 2 + 2 pq + q 2 ( 1 - s) = 1 - sq 2 . 

V 

A la generation ( n + 1), pour les individus d’age adulte, la 
frequence allelique p’ de B sera egale a la somme de la frequence 
genotypique des individus B/B, soit p 2 , et de la moitie de celle des 
individus B/B’, soit 2 pq/2, divisees par la somme des frequences rela- 
tives 1 - sq 2 , d’ou : 
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, p 2 + pq , t , p 

p = £_ !_! , avec p + q = 1 soit p = — - — - 

1 - sq 2 1 - sq^ 


0 ) 


On en deduit que 

Ap = p' - P = _£E3_ (2) 

1 - sq 2 

Le coefficient de selection ayant une valeur toujours positive, 1 - sq 2 
est inferieur a 1, aussi p’ devient a la generation (n + 1) superieur a p. 
Grace a l’equation (2), le calcul de la variation des frequences alleliques 
s’avere possible de generation en generation connaissant le coefficient 
de selection et les frequences alleliques de depart. Si seule, la variation 
des frequences alleliques est connue, on pourra calculer s en combinant 
les equations ( 1 ) et (2) d’ou : 


s= *L 

P’q 2 


Si dans le cas traite, 1’ allele B etait un allele dominant, sa frequence 
augmenterait au fil des generations. Cependant, il faudrait un tres 


Frequences genotypiques des adultes : 

B/B , B/B', B7B' 
p 2 + 2 pq + q 2 = 1 

Generation (n) 

panmixie 


Frequences genotypiques a la naisssance : 

B/B , B/B', B'/B' 
p 2 + 2 pq + q 2 = 1 
aptitude : 1 1 1-s 

Generation (n + 1) 

Selection 

(survie) 


Frequences relatives genotypiques des adultes: 

B/B , B/B', B'/B' 
p 2 + 2 pq + q 2 (1 - s) < 1 

Frequences genotypiques des adultes: 

B/B , B/B', B'/B' 

p 2 / (1 - sq 2 ) + 2 pq / (1 - sq 2 ) + q 2 (1 - s) / (1 - sq 2 ) 


Figure 8,5 Schema recapitulate montrant la variation des frequences genotypiques 
lors d'une selection naturelle. 
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grand nombre de generations pour eliminer completement 1’ allele B’ 
recessif. En effet, plus sa frequence devient rare plus la proportion liee 
au genotype heterozygote ( B/B ’) augmente (Fig. 8.5 et Tableau 8.6). 
Comme les phenotypes B/B et B/B’ sont identiques, la selection n’a 
aucune prise sur 1’ allele B ’ contenu dans F heterozygote ou il demeure 
« a l’abri ». II ne peut done pas etre totalement elimine. 

La panmixie permet uniquement la conservation de ces frequences 
entre deux generations n a l’age adulte et (n + 1) a la naissance. A la 
generation (n + 1), le coefficient de selection entraine une modification 
des frequences chez les adultes. Un exemple numerique ( Tableau 8.6 ) 
illustre ceci avec une valeur hypothetique pour le coefficient de selec- 
tion s de 0,3 pour les homozygotes BVB’. 
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Tableau 8.6 Exemples de variations chiffr£es lors d'une selection naturelle. 



Genotypes 

Total 

B/B 

B/B' 

B'/ff 

A la naissance : Nombre 

4 

32 

64 

100 

Frequence 

0,04 

0,32 

0,64 

1 

Aptitude 

1 

1 

0,7 


A I'age adulte : Nombre 

4 

32 

45 

81 

Frequence relative 

0,04 

0,32 

0,45 

0,81 

Frequence * 

0,05 

0,40 

0,55 

1 


* On constate qu'en une generation, dans la population concernee, la proportion d'individus B/B et B/B' 
a augmente en raison de la selection qui s'exerce sur les individus BVB' entre la naissance et Page adulte. 



POINTS CLEFS 


> II existe un polymorphisme genetique des populations. Les populations 
naturelles se composent en effet d'individus genetiquement differents 
pour un grand nombre de genes. Confrontees aux modifications des fac- 
teurs environnementaux, ce polymorphisme constitue pour les especes 
un veritable capital adaptatif permettant leur survie. 

> La genetique des populations s'efforce d'evaluer la diversite genetique et 
d'etablir des lois decrivant dans le temps et I'espace le maintien ou la 
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modulation de la variation genetique au sein d'une population. Son point 
de depart est la recherche des differents alleles d'un gene dans une 
population concernee et I'analyse des frequences de ceux-ci. 

> Dans une population naturelle, les accouplements aleatoires (condition 
panmictique) sont en general la regle.La distribution des alleles a un locus 
donne reflete cette condition. 

> Le modele de Hardy-Weinberg s'applique a une population theorique 
d'individus qui se reproduisent entre eux. Aucune mutation ne doit appa- 
raitre au locus etudie et la population n'a pas de variation d'effectif liee a 
un flux migratoire. 

> Dans une population theorique repondant au modele de Hardy-Weinberg, 
les frequences alleliques et genotypiques a un locus ne varient pas au fil 
des generations. 

> Plus un allele est rare dans une population, plus la proportion d'hetero- 
zygote est superieure a celle des homozygotes pourcet allele. 

> On parle d'endogamie ou de consanguinite lorsqu'il y a union entre indivi- 
dus apparentes. 

> Le coefficient de consanguinite manifeste la probability qu'un ancetre ait 
transmis a ses 2 descendants directs le meme allele parmi les deux dis- 
tincts qu'il possede a un locus donne. 

> Le coefficient de selection, s, traduit la difference entre la valeur de survie 
pour chaque categorie genotypique et la meilleure dans cette population. 


QCM - QROC 

Q 

8.1 On observe que dans une population soumise au test de sensibilite 
au PTC, 70 % des indi vidus sont sensibles. En supposant que ce pheno- 
type est lie a un allele dominant S et l’insensibilite au PTC a l’allele 
recessif s, quelles sont les frequences des alleles et des genotypes 
dans cette population 

8.2 Dans une population le taux de mutation de G — > g est de 4 x 10 -6 . 
Si p = 0,8 peut-on predire ce qu’il sera dans 50000 generations ? 

8.3 Une population essentiellement composee d’individus fertiles de 
genotypes A/A etA/a comporte 0,1 % d’individus a/a. Quelle pression 
de selection s’exerce contre les individus de genotype a/a si le taux de 
mutation A — > a est de 10 -5 ? 

8.4 Percevoir l’amertume du phenylthiocarbamide (PTC) est une 
caracteristique dominante non liee au sexe et son contraire, une carac- 
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teristique recessive. Une femme qui pergoit l’amertume et dont le 
pere ne la pergoit pas, epouse un homme ayant un phenotype de sensi- 
bility. Ce monsieur a deja eu dans une union precedente, une fille 
insensible au PTC. a) Quelle est la probability que leur premiere fille 
soit insensible ? b) soit sensible ? c) leur premier gargon soit 
sensible ? d) la probability que leurs deux premiers enfants de l’un ou 
1’ autre sexe soient sensibles ? 

8.5 Une population theorique repond au modele de Hardy- Weinberg 
si : a) la formation des couples s’opere au hasard ; b) l’un des genoty- 
pes augmente l’esperance de vie ; c) une selection s’opere au niveau 
des gametes ; d) tous les individus adultes peuvent se reproduire ; e) 
la taille de la population est restreinte. 

8.6 La galactosemie est une maladie genetique rare dont la frequence 
observee a la naissance est de 1/40 000. Calculer le rapport : indivi- 
dus porteurs sains sur individus atteints, que traduit-il ? 

8.7 Parmi ces propositions lesquelles sont exactes : a) l’accouple- 
ment de deux individus apparentes diminue la probability qu’un allele 
provenant de leur ancetre commun soit present a l’etat homozygote ; 
b) la consanguinity augmente la frequence des mutations ; c) L’endo- 
gamie systematique favorise la fixation d’un allele ; d) Le coefficient 
de selection entraine une modification des frequences genotypiques a 
la naissance. 

8.8 Donner la frequence la plus haute que peut atteindre un allele 
recessif, letal a l’etat homozygote. Quelle est alors la constitution 
genetique de la population ? 

8.9 Le groupe sanguin M-N chez l’homme depend d’une paire 
d’ allele codominants L M et L N . Dans une population arctique, 100 
Esquimaux sont du groupe M, 40 sont du groupe MN et 1 0 du groupe 
N. Calculer la frequence des alleles L M et L N ; dans un echantillon de 
350 individus, quel sera le nombre des individus de groupe MN ? 


REPONSES 


8.1 Puisque 70 % des individus sont sensibles au PTC, 30 % sont 
insensibles. La frequence des homozygotes recessifs est q 2 , d’ou 

q = V0, 30= 0,55. 

Comme p + q = 1 on a : /; = 1-^= 1 - 0,55 = 0, 45. 

D’ou : p 2 = 0,45 2 = 0,20 (S/S) -,2pq = 0x 0,45 x 0,55 = 0,50 (S/s) 
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q 2 = 0,30 (s/s) 


8.2 La frequence allelique devient de plus en plus faible au cours 
des generations. Ap egalement. Apres 50 000 generations on a : 


p = 0,8 x e 


(50 000 x4 x 10 6 ) 


= 0,65. 


8.3 0,01. 


8.4 On definit une probability comme le rapport du nombre d’arrivees 
d’un evenement sur le nombre d’ occasions qu’il a de se produire 
(nombre d’essais). Si G est l’allele dominant sensible et g, F allele 
recessif, insensible, les genotypes respectifs du pere et de la mere sont 
Gg. La probability de chaque allele etant de 1/2 et celle du genotype 
insensible gg de 1/4, pour chaque sexe, soit une probability de (1/4 x 1/2) 
= 1/8, pour une premiere fille insensible. La probability du genotype 
sensible G- est de 3/4, soit pour une fille ou un gar^on de (3/4 x 1/2) 
= 3/8. La probability que deux evenements independants se produisent 
simultanement est le produit de leurs probabilites respectives. La 
probability que les deux premiers enfants, independamment de leur 
sexe, soient sensibles sera done de 3/4 x 3/4 = 9/16. 

8.5 a) vrai ; b) faux ; c) faux ; d) vrai ; e) faux 


8.6 La frequence de l’allele mute q est egale a qqq = 0,005; 

1’ allele normal a une frequence de 1 - q soit 0,995. Le rapport des 
frequences individus porteurs sains sur individus atteints est de 

1— ii — (0> 005) x 0,995] _ • ce ra pport eleve traduit la faible 

0,005 

frequence de F allele mute au locus du gene implique. 

8.7 a) vrai ; b) faux, elle augmente la proportion des homozygotes ; 
c) vrai ; d) faux, il entraine une modification des frequences genotypi- 
ques a l’age adulte. 

8.8 0,5 ; tous les individus sont heterozygotes. 

8.9 La frequence de l’allele L M est de : [(= 0,8 ; pour L N elle est de : 

(1-0,8) = 0,2; 

Dans une population de 350 Esquimaux, le nombre d’ individus de 
groupe MN serait de : 2 x 0,8 x 0,2 x 350 = 112. 


Copyright © 2015 Dunod. 


Glossaire 


Pour se reperer plus facilement, les mots du glossaire sont en couleur 
dans le cours. 


adduct : divers groupes chimiques reactifs d’origine environnementale, 
accoles par voie enzymatique ou chimique a 1’ ADN et provoquant des 
erreurs de replication. 

ADN polymerase : famille d’ enzymes qui synthetisent de nouveaux 
brins d’ ADN a partir d’une matrice modele. 

allele : une des di verses formes d’un gene presente a un locus 

ARN non codant : designe tout ARN resultant de la transcription 
d’une sequence d’ ADN jamais traduit en proteine. 

bacteriophage : virus qui infecte une bacterie. 

centromere : region specialisee de l’ADN de chaque chromosome 
eucaryote maintenant ensemble les chromatides sceurs. C’est aussi le 
site de liaisons des proteines du kinetochore qui capturent ensuite les 
microtubules a partir des fuseaux mitotiques et meiotiques. 

centrosome : organite organisateur de microtubules agissant comme 
pole du fuseau pendant la mitose. II contient souvent une paire de 
centrioles. 

chromatide : copie d’un chromosome par replication de 1’ ADN jointe 
encore a 1’ autre copie par le centromere. 

chromatine : complexe macromoleculaire du noyau d’une cellule 
eucaryote forme par l’ADN, les histones, certains ARN et d’autres 
proteines non-histones. Materiau constitutif des chromosomes. 

chromosome : arrangement lineaire de genes et d’autres formes 
d’ ADN, associe parfois avec certains ARN et proteines. 

chiasma : structure en forme de croix observee entre des chromatides 
non-soeurs lors de la meiose. 

clone : population de cellules ou d’organismes genetiquement iden- 
tiques, issus d’une meme cellule ou d’un meme ancetre. 
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chromosomes polytenes : chromosomes geants produits par un 
processus endomitotique au cours duquel de nombreux segments 
d’ ADN restent lies. 


cluster : region regroupant des genes ayant des fonctions similaires 
mais d’une structure differente en modifiant la regulation de leur 
expression, a la fois dans le temps et dans l’espace. 

codominance : situation dans laquelle un heterozygote presente de 
maniere equivalente les effets phenotypiques des deux alleles. 


coiffe : designe 1’ addition a l’extremite 5’ d’un ARN messager d’une 
methylguanine phosphate, protegeant le dit ARN d’une degradation 
exonucleasique. 


complementation : production d’un phenotype de type sauvage par 
deux mutations differentes combinees au sein d’une cellule diploide 
ou d’un heterocaryon. 

conjugaison : union temporaire de deux organismes unicellulaires 
(bacteries, protistes,...) au cours de laquelle une cellule donneuse 
transfere du materiel genetique a une cellule receveuse. 

croisement test : croisement d’un individu de genotype inconnu ou 
d’un heterozygote avec un individu de genotype double recessif pour 
le ou les caracteres etudies. 


crossing-over : echange de fragments chromosomiques semblables 
entre des chromatides non soeurs homologues. 

contigs : groupes ordonnes de clones chevauchants qui assembles, 
reconstituent une region chromosomique ou un genome. 

cycle cellulaire : cycle de reproduction de la cellule oscillant entre la 
mitose (M) et 1’ interphase (G,, S et G 2 ) et constitue d’une sequence 
d’evenements par lesquels la cellule duplique son contenu avant de se 
diviser en deux cellules. 

cytogenetique : approche cytologique de la genetique par une etude 
en microscopie des chromosomes. 

diploide : cellule ou organisme qui possede deux jeux complets de 
chromosomes homologues (c’est-a-dire deux alleles pour chaque locus 
genetique). Les cellules somatiques possedent 2 n chromosomes. 

division equationnelle : division qui maintient constant le nombre de 
chromosomes ou niveau de ploi'die des cellules. 

division reductionnelle : division nucleaire qui genere des noyaux-fils 
possedant chacun la moitie des chromosomes contenus dans le noyau 
parental. 
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domaine activateur : region d’une proteine qui interagit directement 
avec le domaine carboxy-terminal de l’ARN polymerase et stimule 
ainsi la transcription. 

dominance : designe l’effet d’un allele ou d’un gene qui impose le 
phenotype chez un heterozygote. S’ oppose a recessivite. 

double helice d’ ADN : structure de l’ADN, composee de deux brins 
en forme d’ helice entrelaces relies par des liaisons hydrogene par 
appariement des bases. 

empreintes genetiques : aussi appelees « Test ADN », est une tech- 
nique pour identifier des individus de la meme espece en comparant 
de courte sequences de leur ADN. 

empreinte parentale : phenomene epigenetique par lequel l’activite 
d’un gene chez un individu depend du parent qui l’a transmis. Certains 
genes ont done une empreinte maternelle et d’autres une empreinte 
paternelle. 

enhancer : stimulateur, defini comme une sequence d’ADN qui, 
lorsqu’elle est liee par une proteine dite activatrice, facilite l’expression 
d’un gene en fonction du tissu considere. II est parfois tres eloigne en 
amont ou en aval du gene cible. 

epissage : reaction complexe consistant en 1’ elimination des introns 
et en 1’ assemblage des exons constitutifs d’un transcrit primaire d’un 
gene. 

epigenetique : e’est le domaine de la genetique qui prend en compte 
les effets de l’environnement et de leur histoire individuelle sur le 
devenir des etres vivants. Elle etudie plus precisement les modifica- 
tions de 1’ expression des genes qui sont a la fois transmissibles et 
reversibles d’une generation a 1’ autre sans pour autant que soit alteree 
la sequence en bases de l’ADN. 

epissage alternatif : processus par lequel a partir d’un meme transcrit 
primaire des ARN messagers differents sont produits a la suite de 
variations dans le patron d’epissage du pre-ARNm. 

epistasie : situation dans laquelle 1’ expression phenoty pique differen- 
tielle d’un genotype a un locus depend du genotype a un autre locus. 

exon : toute section non intronique de la sequence codante d’un gene. 
Lorsqu’ils sont assembles apres 1’ epissage du transcrit primaire les 
exons constituent 1’ ARN messager qui est traduit en proteine. 

episome : element genetique qui peut se repliquer de fa^on indepen- 
dante dans le cytoplasme de la bacterie. II peut egalement integrer le 
chromosome bacterien et se repliquer alors en meme temps que lui. 
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facteur F : episome bacterien qui confere a la cellule qui le possede 
la propriete de transmettre du materiel genetique. 

frequence allelique : mesure de la presence d’un allele dans une 
population par rapport a tous les alleles d’un gene, presents dans la 
meme population. 

frequence genotypique : proportion d’individus ayant un genotype 
donne au sein d’une population. 

genome : ensemble du materiel genetique contenu dans le ou les 
chromosomes d’une cellule. 

genotype : composition allelique specifique d’une cellule pour un 
gene, un groupe de genes voire la totalite de son genome. 

haploide : cellule ou organisme ne possedant qu’un seul jeu de 
chromosome. 

frequence de recombinants : pourcentage ou proportions d’individus 
ou de cellules recombinants dont le phenotype differe des phenotypes 
parentaux de depart. 

generation FI : premiere generation de descendants produite par le 
croisement de deux lignees parentales. 

generation F2 : deuxieme generation de descendants issue d’un croi- 
sement entre individus d’une meme FI ou par autofecondation chez 
les vegetaux. 

haplotype : classe genetique decrite par une sequence d’ ADN (combi- 
naison de SNPs) ou de genes presents sur un chromosome (combinaison 
des alleles). 

heredite : ressemblance des caracteres entre parents et descendants. 

heritabilite : proportion de la variance phenotypique dans une 
population attribuable a la variance genotypique. 

heterozygote : organisme possedant pour un meme gene deux alleles 
differents. 

histone : proteine basique constituant des complexes octameriques (2 
exemplaires de chacune des histones H2A, H2B, H3 et H4) autour 
desquels 1’ ADN est enroule pour former les nucleosomes des chromo- 
somes eucaryotes. L’histone HI participe a la cohesion de 1’ ensemble. 

homeoboite : courte sequence d’ADN d’environ 180 pb, situee au sein 
d’un gene implique dans la regulation du developpement des animaux, 
champignons et plantes. Ces genes sont nommes pour cette raison 
« genes a homeoboites » et forment la famille des genes homeotiques. 
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homeodomaine : domaine proteique d’environ 60 acides amines, 
present dans la sequence peptidique de l’homeoboite et capable de se 
lier a l’ADN. 

homozygote : organisme possedant pour un meme gene deux alleles 
identiques. 

inducteur : molecule ou plus generalement agent de l’environnement 
qui stimule la transcription de l’ADN a partir d’un promoteur. 

interference : mesure dans une region chromosomique de 1’ indepen- 
dance des crossing-over les uns des autres. 

intron : region non codante d’un gene eucaryote, situee entre deux 
exons, transcrite en ARN mais ensuite excisee par epissage et absente 
de l’ARN messager mature traduit en proteine. 

IRES : « internal ribosome entry site », sequences internes particulieres 
des ARN messagers eucaryotes et des ARN viraux eucaryotes fonction- 
nant comme des sites d’ entree des ribosomes a 1’ instar des sites de 
liaison RBS situes a l’extremite 5’ de 1’ ARN messager procaryote. 

isolateur : nom donne a une sequence regulatrice au sein de l’ADN 
separant les stimulateurs (enhancers) de certains promoteurs. Lorsqu’il 
est occupe par une proteine appropriee l’isolateur bloque la communi- 
cation entre les proteines activatrices liees aux stimulateurs et certains 
promoteurs. 

jonction de Holliday : structure intermediaire dans la recombinaison 
genetique impliquant deux molecules d’ADN double brin, reliees par 
1’ intermediaire d’un crossing-over reciproque interessant un brin de 
chaque molecule. 

Q 

kinetochore : complexe de proteines auxquelles s’ attache les micro- 
tubules constituant les fibres du fuseau mitotique nucleaire jouant un 
role actif dans le mouvement des chromosomes vers les poles. 

liaison a l’X : mode de transmission des genes presents dans la 
region differentielle du chromosome X et absents du chromosome Y. 

LINE : appeles longs elements nucleates disperses, ils correspondent 
a des elements transposables de classe 1 codant une transcriptase 
inverse. 

lysogenie : un des deux types de developpement s’appliquant a une 
bacterie infectee par un phage tempere. Dans ce mode, le genome du 
phage est reprime. II s’integre dans le genome bacterien et se replique 
comme ce dernier. Sous l’effet d’une induction environnementale 
mettant en cause la survie de la bacterie-hote, la derepression du genome 
viral se produit et le mode de developpement lytique s’installe entrainant 
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la production de nouvelles particules virales et leur liberation dans 
l’environnement par la lyse de la bacterie. 

meiose : deux divisions successives qui produisent les gametes chez 
les animaux et les spores chez les champignons et vegetaux. Les 
4 cellules qui en resultent, possedent la moitie du materiel genetique 
de la cellule d’origine. 

microsatellite : nom donne a de courtes sequences d’ ADN constitutes 
par la repetition en nombre variable selon les individus de di- ou 
trinucleotides. Exemple : la repetition de nucleotides contenant thymine 
et guanine, (TG) n . 

microtubule : tubules fins et creux assembles a partir de sous-unites 
de la tubuline. Ils forment le plus important des trois systemes de cablage 
filamenteux du cytosquelette. 

morphogene : molecule qui intervient directement par son activite et 
en fonction de sa concentration dans la morphogenese d’un organisme. 

multiallelisme : traduit un nombre eleve d’ alleles differents pour un 
meme gene dans une population donnee. 

mutations ponctuelles : modification hereditaire de la sequence 
nucleotidique d’un chromosome portant sur une seule base purique 
(A, G) ou pyrimidique (T, C). II peut s’agir d’une transversion 
(Pu <=> Py) ou d’une transition (Pu o Pu ou Py <=> Py). 

nucleosome : unite de base de la structure d’un chromosome eucaryote 
(voir histone). 

octade : asque contenant huit ascospores, produit chez des especes 
dont la tetrade subit une division mitotique apres la meiose. 

octamere : complexe moleculaire compose de 8 sous-unites ou mono- 
meres. Le noyau proteique d’un nucleosome se compose d’un octamere 
d’histones. 

operateur : designe une region de 1’ ADN situe au debut d’un ensemble 
de genes adjacents transcrits simultanement (operon). L’operateur est 
le site de liaison d’une proteine dite represseur de 1’ operon. 

organisme transgenique : organisme dont le genome a ete modifie 
par 1’ introduction d’un ADN etranger porteur de nouveaux genes. 

origines de replication : sequences nucleotidiques ou sites de 
l’ADN ou demarre la replication. 

paramutation : designe l’effet d’un des deux alleles presents a une 
generation et qui affecte de fa^on heritable l’autre allele dans les gene- 
rations ulterieures, meme si 1’ allele responsable du changement n’est 
pas lui-meme transmis. 
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phenotype : forme adoptee par un caractere, liee a un genotype 
specifique. 

pili : ou pilus, appendice porte par une bacterie E. coli donneuse et 
servant de pont pour la transmission d’ADN a une bacterie receveuse 
lors de la conjugaison. 

plasmide : petite molecule d’ADN circulaire extrachromosomique se 
repliquant de fa^on autonome. Considere comme un outil essentiel de 
l’ingenierie genetique. 

ploidie : nombre de jeux de chromosomes presents dans une cellule 
ou un organisme. 

pre-ARNm : molecule d’ARN dite precurseur de l’ARN messager. 
Designe le transcrit primaire d’un gene avant les diverses modifications 
(epissage des introns, eventuel « editing », polyadenylation) conduisant 
a la formation de l’ARN messager mature, devenu apte pour la 
traduction en proteine. 

procaryote : organisme constitue d’une seule cellule sans noyau, le 
materiel genetique etant dans le cytoplasme. 

promoteur : sequence d’ADN en amont de l’extremite 5’ de la sequence 
d’un gene, constituant le site de liaison des ARN polymerases assurant 
le demarrage de la transcription. 

prophage : chromosome phagique insere au sein de l’ADN d’un 
chromosome bacterien. 

proteine Cro : une des principales proteines regulatrices impliquees 
dans le mode lytique de l’infection d’une bacterie par le phage X (voir 
mode lysogene et mode lytique). 

Q 

recessivite : ce terme s’emploie pour designer un allele, present chez 
un heterozygote, qui ne peut donner un phenotype lorsqu’il est seul ; 
le phenotype etant impose par 1’ allele dominant. 

recombinaison : terme general designant tout processus cellulaire 
qui engendre une nouvelle combinaison genique ou chromosomique 
non preexistante dans la cellule en question ou dans ses progeniteurs. 
Designe aussi le processus similaire qui se produit a la meiose au 
cours de la formation d’un produit haploide different des haploi'des 
constituant le diploi'de meiotique initial. 

recombinaison homologue : recombinaison entre deux molecules 
d’ADN de sequences similaires, frequente au cours de la meiose et de 
la mitose chez les eucaryotes. 

recombinaison interchromosomique : recombinaison resultant d’un 
assortiment independant des chromosomes a la l re division meiotique. 
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recombinaison intrachromosomique : recombinaison resultant d’un 
crossing-over entre deux loci portes par des chromosomes homologues. 

represseur : designe la proteine qui se lie a une sequence regulatrice 
de l’ADN ou sur l’operateur d’un gene et qui bloque la transcription. 

represseur A, : designe le represseur specifique du phage A. qui bloque 
la transcription des genes du mode lytique et oriente le processus 
infectieux du phage A. vers le mode lysogene marque par 1’ integration 
du genome viral dans le chromosome bacterien sous la forme du 
prophage. 

shotgun : methode qui consiste a fragmenter en morceaux de tres 
petite taille l’ADN chromosomique, a cloner les fragments puis a les 
sequencer directement. 

silencer : extincteur, defini comme une sequence d’ ADN qui, lorsqu’elle 
est liee par une proteine inhibitrice (represseur), bloque 1’ expression 
d’un gene en fonction du tissu considere. Cette sequence est parfois 
tres eloignee en amont ou en aval du gene cible. 

SINE : ou courts elements nucleaires disperses, correspondent a des 
elements transposables de classe 1 mais ne codent pas une transcriptase 
inverse, utilise celle des LINE. 

site d’epissage : sequences aux extremites 5’ et 3’ d’un intron grace 
auxquelles s’effectue l’epissage de 1’ intron. 

spliceosome : complexe ribonucleoproteique de grande taille implique 
dans le processus d’epissage (« splicing ») des transcrits primaires 
d’ARN. 

stimulateur : ou activateur ou « enhancer », sequences d’ADN, sites 
de liaison de facteurs de transcription agissant positivement sur la 
transcription des genes souvent proches de ces sequences. 

suppresseur : mutation qui peut faire disparaitre l’effet d’une mutation 
sur un autre gene et restituer le phenotype sauvage. 

telomerase : enzyme qui utilise comme matrice une petite sequence 
d’ARN pour catalyser 1’ addition d’ unites nucleotidiques repetees aux 
extremites des chromosomes lineaires eucaryotes afin de compenser 
leur raccourcissement consecutif a la replication. 

telomere : sequence particuliere situee a l’extremite d’un chromo- 
some lineaire eucaryote. 

topoisomerase : enzyme qui introduit des surenroulements positif s ou 
negatifs dans un duplex circulaire ferme. Elle clive les polynucleotides 
des duplex surenroules afin de relacher les contraintes puis reconstitue 
la liaison phosphodiester. 
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traduction : processus au cours duquel 1’ information genetique 
contenue dans une molecule d’ARN messager determine la sequence 
des acides amines lors de la synthese proteique. 

transcription : processus enzymatique au cours duquel l’information 
genetique contenue dans une molecule d’ADN simple brin determine 
par complementarite des bases la sequence en nucleotides d’une chaine 
d’ARN. 

transcrit primaire : ARN initial resultant du processus de la trans- 
cription (voir pre-ARNm). 

transduction : transfert de gene d’une bacterie a une autre par 
1’ intermediate d’un phage. 

transduction generalisee : capacite de certains phages a transduire 
n’importe quel gene dans le chromosome bacterien. 

transduction specialise : capacite pour un phage specifique de trans- 
duire que des regions particulieres d’un chromosome bacterien. 

transformation : modification dirigee d’un genome par introduction 
dans la cellule-hote d’un ADN exogene ce qui donne a la cellule un 
nouveau phenotype. 

transition : designe les mutations ponctuelles substituant entre elles 
les bases puriques ou les bases pyrimidiques (voir mutation ponctuelle). 

transposition : ensemble des mecanismes moleculaires assurant la 
mobilite d’un gene ou d’un ensemble de genes d’un site du genome a 
un autre. 

transversion : designe les mutations ponctuelles substituant les bases 
puriques et pyrimidiques entre elles (voir mutation ponctuelle) 

zygote : cellule formee par la fusion d’un gamete male (spermatozoi'de) 
et d’un gamete femelle (ovule). Le diploide forme se divisera pour 
creer un organisme diploide differencie. 
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Pour se reperer plus facilement, les occurrences principales des mots de 
P index sont en gras dans le cours. 


A 

acetylation des histones 1 38 
acrocentrique 75 
adaptability 42 
adaptation 42 
ADN 

glycosylase 3 1 
intergenique 70 
nucleosomal 68 
agent mutagene 28 
allele 89 
altruisme 43 

analyse des frequences 233 
anaphase 1 67 
antiparallele 64 
appariement 

complementaire 64 
aptitude a la survie 245 
ARN autoepissable 209 
autosome 187 
auxotrophe 90 

B 

BAC 77 
bicatenaire 61 
bivalent 167 
bras long 142 
brin 

codant 1 24 
transcrit 124 

C 

cadre ouvert de lecture 134 
capacite a se reproduire 42 
capital adaptatif 233 
capping structure 136 
cartography par 
transduction 106 
centromere 166 
chromosome sexuel 187 
co-dominance 14 
codon 

de demarrage 1 34 
de terminaison 134 
coefficient 

de consanguinity 243 
de parente 242 
de selection 245 


cohesine 7 1 
colonie 90 

compatibility des gametes 
42 

competence naturelle 100 
competent 100 
competition sexuelle 42 
complexe 

mediateur 124 
conditionnel 1 10 
conjugaison 92 
bacterienne 94 
consanguinity 242 
constitute 1 24 
contrainte topologique 66 
croisement 

entre phages 108 
test 5 

crossing over 33 
cyanobacterie 90 

D 

desequilibre de liaison 50 
dessein intelligent 207 
dimer e de thymine 30 
diploide 72, 89 
division 

equationnelle 167 
reductionnelle 167 
dominance 
incomplete 14 
negative 14 
dominant 16, 89 
dominante negative 37 
donneur 92 

E 

electroporation 190 
endogamie 242 
systematique 244 
endogenote 98 
environnement 48 
episome 93 

epissage desintrons 125 
epistasie 196 
espace intergenique 74 
evo-devo 207 


excision 

d’un nucleotide 31 
d’une base 31 
exconjugant 94 
exogenote 98 
exon 18 

F 

F - 93 
F+ 93 
facteur 

additionnel 1 24 
de fertility 93 
general de la 

transcription 1 24 
fecondite croisee 42 
fixation 245 
frequence 43 

G 

G1 71 
G2 71 

gain de fonction 37 
gene 16 
apparie 3 
morcele 1 8 
generalise 105 
genetique inverse 190 
genome 72 

chloroplastique 73 
mitochondrial 73 
nucleaire 7 3 
genomique73, 143 
animale 1 57 
genotype 16, 48 
Glu234 
Gly 234 

gradient de morphogenes 
214 

H 

haplodiplobiontique 110 
haploide 72, 89 
helice-tour-helice 126 
heritabilite 44 
heterogametique 1 87 
heterozygote 16 
Hfr 94 


262 


Ginitique 


histone 
HI 69 
H2A68 
H2B68 
H3 68 
H4 68 

homogametique 187 
homogamie 242 
homozygote 16 

I 

IHF106 
ilots CpG 139 
individu diploi'de 236 
induction 104 
hit 106 
interphase 72 
intragenique 110 
intron 18 
invalidation 

conditionnelle par le 
systfeme Cre/Lox 193 
de g&nes 1 14 
isoforme proteique 131 

K 

kinetochore 166 
knock-out 190 
Kpb 73 

L 

Leu 234 
liaison 

genetique 173 
hydrogfene 61 
lignee germinale 192 
lyse 102 
lysogfcne 104 

M 

M 71 

macroevolution 206 
marqueur genetique 91 
meiocyte 167 
meiose 167 
1167 
H167 

merozygote 98 
metacentrique 75 
metaphase 166 
methylation de l’ADN 138 
microevolution 206 
microsatellite 28 
migration de branche 33 
monde ARN 208 
monocistronique 134 


Mpb 73 
mutant 

calabolique 91 
nul 190 
resistant 91 

N 

niveau basal 124 
nombre de descendants 42 
nonpermissif 110 
nucleoide 74 

O 

octade 180 
origine de transfer! 95 

P 

panmictique 236 
panmixie236 
permissif 110 
perte de fonction 37 
pharmacogenomique 155 
phenotype 16, 48 
phosphodiester 61 
pili 93 
plasmide 
F’ 96 
R 99 

pleiotrope 16 

point chaud de mutation 28 
polyadenylation 125 
polycistronique 134 
polymorphisme genetique 
233 

principe 

de l’heredite 233 
de selection 233 
de variation 233 
profil de segregation 

de premiere division 181 
de seconde division 181 
prophase 165 
proteine recombinante 118 
proteomique 146 
prototrophe 90 

Q 

QTL50 

queue d’histone 69 

R 

recessif 16, 89 
receveur 92 
recombinaison 

intrachromosomique 171 
intragenique 110 
meiotique 167 


region 

differentielle 188 
pseudo-autosomale 187 
replication en cercle 
roulant 94 
resequence 81 
resolution de la jonction 33 

S 

S 71 

sequence 
codante 134 
transposable 70 
Ser 234 

sillonhelicoidal 66 
site d’epissage 
en 3’ 134 
en5’ 134 
SNP52, 81 
souris chimere 192 
specialise 106 
SRY 188 
suppresseur 198 

T 

technique d’obtention 
d’hybrides somatiques 
184 

telocentrique 75 
telophase 167 
tempere 104 

test d’allelisme structural 

110 

testeur 169 
tetrade 113 
theimosensible 112 
transcriptomique 146 
transformation artificielle 
101 

transposition 33 

U 

URA3 115 

V 

variance genotypique 
additive 44 
variation aleatoire 48 
vecteur d’expression 118 
viabilite et selection des 
gametes 42 
virulent 104 

X 

Xis 106 


